去年,在华为开发者大会2020(Cloud)期间,华为云人工智能领域首席科学家田奇在主题演讲中发布了华为视觉计划。这是一个立足当下、着眼未来的研究计划,包含三大方向和六大课题,系统梳理了计算机视觉领域面临的困难和未来发展方向。
经过一年的努力,华为研究团队在不少研究领域都取得了长足的进展。在过去的一年内,研究团队发表顶级会议和期刊论文超过50篇,拿下多项国际竞赛的冠军,并且在20余个实际项目上取得了落地应用。
数据高效、模型高效、知识高效,是计算机视觉的重点研究方向
计算机视觉,本质上是从视觉数据中学习知识的学科。在大数据时代,深度学习技术蓬勃发展,为计算机视觉带来了辉煌的今天。计算机视觉算法在限定场景下已经取得了令人瞩目的成就,然而监督学习带来的红利将逐渐减弱。当前,计算机视觉算法面临对数据需求大、模型难以设计、知识难以抽取等问题,从而导致其难以复制到不同的场景里去。想要更进一步,就必须直面上述挑战,设计数据高效、模型高效、知识高效的计算机视觉算法。
数据高效:数据冰山和数据魔方
为了达到数据高效的目标,华为提出数据冰山计划和数据魔方计划。数据冰山的目标在于高效撬动无标注数据:为此华为设计了小样本学习算法,将实际应用场景中的标注数据需求量减少了80%以上,同时保证算法的精度与基线相当。相应的论文《异步教师学生优化算法》发表在顶级会议CVPR2021上。数据魔方的目标在于从多模态数据中获取更多有效信息:为此华为设计了高效模态融合算法,高效融合了图像、点云等模态信息,一举拿下nuScenes2020三维物体检测竞赛冠军。
模型高效:模型摸高和模型瘦身
为了达到模型高效的目标,华为提出模型摸高计划和模型瘦身计划。模型摸高的目标在于设计强大的视觉骨干模型,为此华为提出了利用知识蒸馏辅助数据扩增的算法,相应的论文《消除自动数据扩增中的离群样本》发表在ECCV2020上,同时在近一年的时间内,占据ImageNet无额外数据榜单第一名。模型瘦身的目标在于设计高效的视觉骨干模型以适应端侧和边缘侧设备,为此华为提出了一系列网络架构搜索算法,发表顶级会议和期刊文章近10篇,在ImageNet等数据集的限定算力赛道上保持领先。
知识高效:万物预视和虚实合一
为了达到知识高效的目标,华为提出万物预视计划和虚实合一计划。万物预视计划的目标在于利用大量的无标签数据构造预训练模型,使其在各类下游任务上取得良好的泛化性能,为此华为提出了一系列自监督学习算法,通过充分挖掘样本间的关联性,大幅提升了预训练模型的下游应用能力。虚实合一计划的目标在于利用虚拟数据提升真实场景下的算法性能,为此华为构建了虚拟场景和针对性的采样、适配算法,目前已经在行人重识别问题上取得了业界领先的迁移性能,相应的论文也发表在顶级会议CVPR2021上。
《华为视觉计划》的核心点为模型、数据、知识:模型立足当下发展,数据面向中短期突破,知识着眼长远未来。在深度学习带来的模型红利逐渐稀薄的情况下,华为探索新的学习范式,从全监督数据过渡到弱监督甚至无监督数据,并且将知识引入训练和推理过程,通过这两条新的研究路径,颠覆现有学习范式,引领业界的研究潮流。
华为开发者大会2021(Cloud)(简称HDC.Cloud 2021)上,华为云基于华为视觉计划,将为开发者带来一份神秘大礼。这份礼物,将助力大部分开发者和企业,使得他们能够基于更高效的平台,更容易地开发出高效的视觉算法。
作为华为ICT基础设施业务面向全球开发者的年度盛会,华为开发者大会2021(Cloud)将于2021年4月24日-26日在深圳举行。本届大会以#每一个开发者都了不起#为主题,将汇聚业界大咖、华为科学家、顶级技术专家、天才少年和众多开发者,共同探讨和分享云、计算、人工智能等最新ICT技术在行业的深度创新和应用。智能时代,每一个开发者都在创造一往无前的奔腾时代。世界有你,了不起!