人工智能|开拓人工智能视觉知识的“北大荒”
admin
2023-05-03 17:38:52
0


人工智能|开拓人工智能视觉知识的“北大荒”
文章图片
【人工智能|开拓人工智能视觉知识的“北大荒”】潘云鹤
■采访人员 韩扬眉
近年来,图像识别水平的快速提升推动了人工智能热潮 。图像识别技术的突破不仅提高了计算机对人脸、文字、指纹及生物特征、医学图片等识别的准确率,而且进一步推动了安全监控、智能交通、无人机、智能制造等多领域的发展,但其进一步发展也遇到了诸如可解释、可分析综合、可设计仿真等方面的挑战 。
对此,在《信息与电子工程前沿》上,中国工程院院士、浙江大学教授潘云鹤提出了“视觉知识”概念 。他认为,实现视觉知识表达、推理、学习和应用技术将是人工智能2.0取得突破的关键所在 。近日,潘云鹤在接受《中国科学报》专访时,详细阐述了视觉知识发展面临的5个基本问题 。
“认知心理学早已指出,心象是人类知识记忆的重要部分,被用来进行形象思维 。视觉知识就是计算机对心象的模拟 。”潘云鹤指出 。
潘云鹤认为,视觉知识表达是第一大问题 。与当今人工智能所用的知识表达方式不同,视觉知识概念具有典型与范畴结构、层次结构与动作结构等要素 。视觉概念能构成视觉命题,包括场景结构与动态结构;视觉命题能构成视觉叙事,例如无声电影就是视觉叙事的显示形式 。
不同于言语知识,视觉知识的特征是能表达对象的大小、色彩、纹理、空间形状及关系;能表达对象的动作、速度及时间关系;能进行对象的时空变换、操作与推理等 。事实上,人类记忆中储存的视觉知识远多于言语知识 。
视觉识别是第二个问题 。“从人工智能早期开始,模式识别便是最重要的研究领域,其中图象和视频识别是发展最快的方向 。”潘云鹤表示,近年来,深度学习提供的方法是,用大量标识的图像训练出深度神经网络模型用于图像识别,显著提高了正确率,已获广泛应用 。
但与深度神经网络模型方法不尽相同,人类在工作记忆中进行视觉识别时,不仅分析视网膜即时感知后传入短期记忆中的数据,而且激活了长期记忆中过去学到的并记住的相关心象,即视觉知识 。因此,人类在完成视觉识别任务时往往只需少量数据,而且可解释也可推理 。
潘云鹤说,在视觉识别中,协同使用数据和视觉知识,形成数据驱动和视觉知识指导的协同计算范式是视觉识别的重要研究方向 。
第三、四个问题分别是视觉形象思维模拟、视觉知识学习 。潘云鹤指出,视觉形象思维模拟在计算机辅助设计和仿真、计算机动画、游戏、儿童教育和数字媒体创意等领域应用十分广泛,计算机图形学已储备很多基础技术,但有待与人工智能打通 。
“视觉知识学习则要将目标从三维(3D)形状的重建提升到视觉知识概念和命题的重建 。”潘云鹤指出,这就需要对现有计算机视觉技术做进一步研究——不仅要重建3D形状,而且要重构3D形状的概念结构与层次结构 。在此基础上,有望发展出视觉知识的自动学习手段 。“当前的场景图研究是向视觉知识自动学习前进的一个合适的中间方法 。当今,特别需要人工智能、计算机图形学和计算机视觉3个领域的研究者联手研究 。”
多重知识表达是第五大问题 。潘云鹤认为,人脑中的知识往往通过多重表达来描述,因此,人工智能2.0的知识应有多种表达方式,包括知识的言语表达、深度神经网络表达、形象表达等,多重知识表达将形成跨媒体智能和大数据智能新的技术理论和模型 。
“视觉知识和多重知识表达的研究是发展新的视觉智能的关键,也是促进人工智能2.0取得重要突破的关键理论与技术 。”潘云鹤表示,视觉知识的独特优点是具有形象的综合生成能力、时空演化能力和形象显示能力 。人工智能与计算机视觉、计算机辅助设计、计算机图形学技术联合,将为人工智能在创造、预测和人机融合等方面的新发展提供重要的新基础、新动力 。

相关内容

热门资讯

2... 小Q电台 - xiaoQ.FM点歌| 求助| 告白| 分享春水初生,春林初茂,春风不如你~- - ...
铁... “1月28日消息:中国铁路局:抢票软件已被限制。据铁路局介绍,这些第三方软件的相关机顶盒功能已被识别...
2... 转眼间已经是2018年的4月份了,转眼间就快到5月份了,到5月份已经过去半年了,想想时间过得还真快啊...
小... 小米手机如何刷入鸿蒙系统小米手机刷入鸿蒙系统需要按照以下步骤进行:解锁手机。首先你需要在小米手机的开...
i... 物联网智库编写出版介绍近日,德国达姆施塔特工业大学发布的一项研究称,iPhone缺乏数字签名机制,甚...
中... 随着智能手机的普及,越来越多的应用程序涌现,而这些应用程序背后的使用权限和隐私问题也逐渐受到消费者的...
移... 随着移动互联网时代的到来,过去我们只能在PC上完成的操作,现在在手机上只需轻轻一点就可以完成。手机运...
手... 凡是热爱游戏的玩家,都会有自己制作游戏的想法;我们也会对一款糟糕的游戏感叹:这不算什么,我可以做得更...
装... ▲ 此图像由 AI 生成酷家乐、三维家、东易日盛等已有所动作,装修产业链大规模引入AIGC生成式AI...
2... 导语:2月16日,我国“一带一路”TOP10影响力社交智库网易电商研究中心()发布《2022年2月A...
中国白银APP投资者骗局曝光,...   近期,大量投资者反映在“中国白银”等App上遭遇巨额亏损。这些平台打着“低门槛、高收益”的幌子,...
2... VRHome是一款2016年上线的软件,拥有全3D视角设计、支持VR眼镜浏览、高逼真度家具及建材模型...
公... 公众号改版了,所以我关注的公众号都没有收到任何推送通知,问了一圈发现如果不标记星标的话,可能会收不到...
中... 可定期免费领取PS视频教材中国影像网上海站《手机拍照美容》系列培训讲座(免费,公益事业)随着手机摄影...
一... 最近,棒妹突然想学英语,但当她去线下门店问的时候,被告知一年学费要几万,她看了看支付宝,就放弃了。就...
回... 不知道还有多少人记得当年玩过的拍照亭,一个比头还高的大箱子,拉开帘子,里面可以容下好几个人,把大脑袋...
科... 科学梦想集团以“引领科技创新、促进文化传播”为企业使命,自主设计、研发、制作展品3000余件,将展览...
回... 很久很久以前,更准确的说应该是在2003年到2005年之间,那时候还没有智能手机,也没有单反相机大头...
女... 陆爵士照例想说有任何安装或硬件问题吗?可以在文章末尾留言陆先生会用翻牌的方式回答大家最好带上目的和需...
换... 为什么会选择开一家“装扮自拍工作室”呢?我的梦想装扮自拍工作室老板万女士告诉记者,自己最初做民宿生意...