“过去60年来人工智能研究的一大弱点就是视觉知识研究的不足。这是一片充满希望、值得探索的‘无人区’。”2020全球人工智能技术大会此间在浙江杭州举行。中国工程院院士潘云鹤在会上称,视觉知识和多重知识表达研究是发展新的视觉智能的关键,也是促进人工智能2.0取得重要突破的关键理论与技术。
2015年,中国工程院专门设立“中国人工智能2.0发展战略研究”重大咨询项目,其发展规划主要包括大数据智能、群体智能、跨媒体智能、人机混合增强智能和自主智能系统等五方面内容。
其中,跨媒体智能已经兴起。潘云鹤表示,在语言、视觉、图形和听觉之间达成语义贯通,是实现联想、推理、概括的重要关键。
“以视觉知识为例,认知心理学研究指出,人类记忆的视觉知识要远多于言语知识。视觉知识因为难以用语言符号表达,曾被统归为常识。比如看到一只杯子就去拿过来喝水,人类在5岁之前学到的多为视觉知识。”潘云鹤说。
在他看来,视觉知识的独特优势是具有形象的综合生成能力,时空比较能力和形象显示能力,这些正是字符知识和DNN(深度神经网络)所缺乏的,其能在创造、预测和人机融合等方面对人工智能新发展提供新的基础动力。因此人工智能、计算机图形学和计算机视觉这三个领域的研究者特别需要联手研究视觉知识。
“我们相信,人工智能2.0沿着研究视觉知识的方向发展,一定能促进中国科技、经济与社会走向更高质量与水平的快速发展期。”潘云鹤说。