人工智能|开拓人工智能视觉知识的“北大荒”
admin
2023-05-03 17:38:52
0


人工智能|开拓人工智能视觉知识的“北大荒”
文章图片
【人工智能|开拓人工智能视觉知识的“北大荒”】潘云鹤
■采访人员 韩扬眉
近年来,图像识别水平的快速提升推动了人工智能热潮 。图像识别技术的突破不仅提高了计算机对人脸、文字、指纹及生物特征、医学图片等识别的准确率,而且进一步推动了安全监控、智能交通、无人机、智能制造等多领域的发展,但其进一步发展也遇到了诸如可解释、可分析综合、可设计仿真等方面的挑战 。
对此,在《信息与电子工程前沿》上,中国工程院院士、浙江大学教授潘云鹤提出了“视觉知识”概念 。他认为,实现视觉知识表达、推理、学习和应用技术将是人工智能2.0取得突破的关键所在 。近日,潘云鹤在接受《中国科学报》专访时,详细阐述了视觉知识发展面临的5个基本问题 。
“认知心理学早已指出,心象是人类知识记忆的重要部分,被用来进行形象思维 。视觉知识就是计算机对心象的模拟 。”潘云鹤指出 。
潘云鹤认为,视觉知识表达是第一大问题 。与当今人工智能所用的知识表达方式不同,视觉知识概念具有典型与范畴结构、层次结构与动作结构等要素 。视觉概念能构成视觉命题,包括场景结构与动态结构;视觉命题能构成视觉叙事,例如无声电影就是视觉叙事的显示形式 。
不同于言语知识,视觉知识的特征是能表达对象的大小、色彩、纹理、空间形状及关系;能表达对象的动作、速度及时间关系;能进行对象的时空变换、操作与推理等 。事实上,人类记忆中储存的视觉知识远多于言语知识 。
视觉识别是第二个问题 。“从人工智能早期开始,模式识别便是最重要的研究领域,其中图象和视频识别是发展最快的方向 。”潘云鹤表示,近年来,深度学习提供的方法是,用大量标识的图像训练出深度神经网络模型用于图像识别,显著提高了正确率,已获广泛应用 。
但与深度神经网络模型方法不尽相同,人类在工作记忆中进行视觉识别时,不仅分析视网膜即时感知后传入短期记忆中的数据,而且激活了长期记忆中过去学到的并记住的相关心象,即视觉知识 。因此,人类在完成视觉识别任务时往往只需少量数据,而且可解释也可推理 。
潘云鹤说,在视觉识别中,协同使用数据和视觉知识,形成数据驱动和视觉知识指导的协同计算范式是视觉识别的重要研究方向 。
第三、四个问题分别是视觉形象思维模拟、视觉知识学习 。潘云鹤指出,视觉形象思维模拟在计算机辅助设计和仿真、计算机动画、游戏、儿童教育和数字媒体创意等领域应用十分广泛,计算机图形学已储备很多基础技术,但有待与人工智能打通 。
“视觉知识学习则要将目标从三维(3D)形状的重建提升到视觉知识概念和命题的重建 。”潘云鹤指出,这就需要对现有计算机视觉技术做进一步研究——不仅要重建3D形状,而且要重构3D形状的概念结构与层次结构 。在此基础上,有望发展出视觉知识的自动学习手段 。“当前的场景图研究是向视觉知识自动学习前进的一个合适的中间方法 。当今,特别需要人工智能、计算机图形学和计算机视觉3个领域的研究者联手研究 。”
多重知识表达是第五大问题 。潘云鹤认为,人脑中的知识往往通过多重表达来描述,因此,人工智能2.0的知识应有多种表达方式,包括知识的言语表达、深度神经网络表达、形象表达等,多重知识表达将形成跨媒体智能和大数据智能新的技术理论和模型 。
“视觉知识和多重知识表达的研究是发展新的视觉智能的关键,也是促进人工智能2.0取得重要突破的关键理论与技术 。”潘云鹤表示,视觉知识的独特优点是具有形象的综合生成能力、时空演化能力和形象显示能力 。人工智能与计算机视觉、计算机辅助设计、计算机图形学技术联合,将为人工智能在创造、预测和人机融合等方面的新发展提供重要的新基础、新动力 。

相关内容

热门资讯

视... 软件获取在文章最后PotPlayer是KMPlayer前作者姜永熙先生(韩国)制作的一款视频播放软件...
C... 随着科技的发展越来越快,带动了电子产品的快速进步。 手机和电脑的更新速度越来越快。 CD光盘现在被...
心... 在电脑的日常使用中,下载工具是必不可少的一款软件,因为无论是下载文件还是视频助手软件,都需要使用下载...
三... 事实上,作为一个经典机械表的爱好者,我一直对电子表产品不屑一顾。 尽管Apple Watch一推出就...
传... 怎么说? 编者,我是2007年开始玩传奇的,那时候我刚上高中,玩的是我们地区的一个传奇人物——新博浪...
精... 说到金手指,几乎每个游戏都被金手指入侵过,但以下三款游戏的金手指堪称金手指界的王者。传奇&传奇私服插...
搬... 如何打包搬家最高效? 小峰的回答是使用合适的搬运和包装工具。 那么搬家打包工具有哪些呢? 赶紧来看看...
2... 7月6日,2023年世界人工智能大会(WAIC)正式开幕。 金山办公携基于大语言模型的智能办公助手W...
学... 在日常照片修图中,抠图是一项非常复杂的操作。 今天我就教大家一些照片抠图的方法。 学会了,你也能成为...
如... 怎么在ps上画图? PS绘画制作教程! Adobe Photoshop 是一款功能强大的图像处理...
推... 在当今信息爆炸的时代,我们很难集中精力做一件事,更不用说看电视节目了。 然而,看剧已经成为很多人生活...
电... 如何设置电脑定时自动重启? 随着时代的变迁,电脑已经成为我们每个人不可或缺的工具。 使用计算机来处理...
达... 我已经使用耳机很长时间来退烧了。 虽然发烧已经退了,但在无线耳机和有线耳机之间我最喜欢的还是有线耳机...
嵌... 【文本】当有人问“什么是嵌入式系统”时,没有必要看我的文章。 有一句狡猾的说法,找不出任何错误——借...
爱... 首先请问各位电视剧迷,你们最常访问哪个视频平台?小雷猜测,爱奇艺、优酷、腾讯三大公司中,爱奇艺应该是...
全... 大家好,我叫聪明。 不知不觉,我已经在互联网行业工作了3年。 网上创业的项目层出不穷,但始终没有对我...
舒... 虽然已经很久没有听说过“动铁四大天王”了,但舒尔就是其中之一,我非常喜欢的一个品牌。 记得很早以前参...
可... 可靠、高效! 采集管网,就用汇邦通!永远免费慧宇智能测绘技术有限公司(以下简称“慧宇智能”)是广东慧...
手... 现代人确实对手机着迷。 无论身在何处,他们都会习惯性地拿出手机看一眼。 于是,公交车、地铁上随处可见...
千... 老爱好者:ckk我一直用的是价格在600到800之间的入门款,因为经常听音乐,所以对耳机的要求非常高...