谷歌算法大牛分享:计算机视觉模型训练导论(好用工具分享)
admin
2023-10-01 07:47:40
0


谷歌算法大牛分享:计算机视觉模型训练导论(好用工具分享)


文章图片


谷歌算法大牛分享:计算机视觉模型训练导论(好用工具分享)


文章图片


谷歌算法大牛分享:计算机视觉模型训练导论(好用工具分享)


文章图片


谷歌算法大牛分享:计算机视觉模型训练导论(好用工具分享)


文章图片


谷歌算法大牛分享:计算机视觉模型训练导论(好用工具分享)


训练计算机视觉模型是复杂而反复的工作的一个组成部分 , 通常看起来会复杂的令人生畏 。 但是其实了解了模型和基础算法 , 一切都会变得简单了
下面 , 我将着重于有监督的学习 , 该学习使用标记的训练数据来指导模型期望的输出是什么 。 介绍模型训练过程的每个组成部分 , 并将作为大家深入了解计算机视觉的基础 。

型号类型不同的计算机视觉模型可以帮助我们回答有关图像的问题 。
图像中有哪些物体?
图像中的那些对象在哪里?
对象上的关键点在哪里?
每个对象属于哪些像素?
我们可以通过构建不同类型的DNN来回答这些问题 。 然后 , 可以将这些DNN用于应用程序中 , 以解决诸如确定图像中有多少辆汽车 , 一个人是坐着还是站着 , 或者图片中的动物是猫还是狗的问题 。 我们在下面概述了几种最常见的计算机视觉模型及其用例 。
通常 , 计算机视觉模型输出由标签和置信度或得分组成 , 这是对正确标记对象的可能性的一些估计 。 这个定义是故意含糊的 , 因为对于不同类型的模型 , “信心”将意味着截然不同的事物 。
在描述不同类型的模型及其用例时 , 我们将概述一个虚拟衣橱的用例
示例:一个应用程序 , 使用户可以在购买之前虚拟地试穿不同的服装 。
影像分类图像分类尝试识别图像中最重要的对象类别 。 在计算机视觉中 , 我们将每个类称为标签 。 例如 , 我们可以使用通用的分类模型(例如“ alwaysai / googlenet ”)来识别衣物 , 例如“跑步鞋”或“运动衫” , 如下所示 。 该模型将以图像作为输入 , 并且将输出一个标签以及模型对特定标签的信心(与其他标签相比) 。 此外 , 用于图像分类任务的DNN不提供图像中对象的位置 , 因此对于需要此信息的用例 , 例如为了跟踪或计数对象 , 我们需要使用对象检测模型 , 以及接下来的模型描述 。


物体检测当对象的位置很重要时 , 通常使用对象检测 DNN 。 这些网络返回一组坐标 , 称为边界框 , 它指定输入图像中包含对象的区域 , 以及该边界框和标签的置信度值 。 对于我们的“虚拟衣橱”应用程序 , 我们需要一个想要试穿虚拟衣服的人的输入图像 , 然后我们需要在图像中找到该人 。 为此 , 我们可以使用对象检测模型进行人员检测 , 例如' alwaysai / mobilenet_ssd” , 那么它将返回一个围绕图像中每个人的边界框 , 以及标签“人”和输出的置信度值 。 下面显示了可以区分人的对象检测模型的示例 。
注意:知道对象在框架中的位置可以使我们推断出有关图像的某些信息 。 例如 , 我们可以计算出高速公路上有多少辆汽车来规划交通模式 。 我们还可以通过将分类模型附加到对象检测模型上来扩展应用程序的功能 。 例如 , 我们可以将图像中与边界框相对应的部分从检测模型中输入到分类模型中 , 以便我们可以计算图像中相对于轿车的卡车数量 。

注:图片小姐姐就是作者本人
现在 , 我们已经了解了如何将衣服分类 , 例如鞋子或运动衫 , 并且可以在图像中检测到人 , 但是我们仍然需要能够让用户试穿衣服 。 这需要能够将属于检测到的对象的像素与图像其余部分的像素区分开 , 在这种情况下 , 我们将要使用分割 , 接下来将进行介绍 。
图像分割如上所述 , 在某些任务中 , 了解对象的确切形状非常重要 。 这需要为每个对象生成一个像素级边界 , 这是通过图像分割实现的 。 用于图像分割的DNN在语义分割的情况下通过对象类型对图像中的每个像素进行分类 , 在实例分割的情况下通过单个对象对图像中的每个像素进行分类 。
注意:当前 , alwaysAI平台支持语义分段 。 我们一直在寻求发展平台并添加新模型 , 包括执行实例细分的模型 。

相关内容

热门资讯

亿... Edraw 网络图绘制软件是亿图软件公司推出的一款专门用于绘制计算机网络图的软件。该软件功能强大,使...
在... 当小孩子们待在家里时,他们有时会有化全妆并自拍的冲动。如果只是拿起手机随意拍摄,那么只能靠自己的美貌...
剪... 今日节目音频:剑英 (Mac 版)11月27日,剑英正式推出Mac版本,并命名为“剑英专业版”。重要...
防... 防控疫情,学校延迟开学;非常时期,居家学习。按照上级教育部门“停课不停教、停课不停学”的要求,市教育...
资... 小伙伴们,你们平时都是用什么网站或者软件找资源的呢?可以在评论区分享出来,让大家看得懂。但是如果你是...
山... 近日,在中国教育电视台特别节目《直通高考·职教季》中,山东商务职业学院凭借优秀的职教风采、前瞻性的办...
如... 如何让用户关闭广告拦截?仍有不少用户选择关闭广告拦截,但这也是建立在优质广告内容和良好用户体验的基础...
O... 一个DNS不过OneDNS不仅仅是一个公共DNS服务,同时也是一个具备多种办公网络保护和管理功能的S...
百... 我不知道你是否有过这样的感觉——我们对某件事越熟悉,有时我们对它的了解就越少。比如你每天看到家门前的...
A... 想要制作个性化的音乐合成,今天给大家分享一款专业的音频合成制作工具,那就是Acoustica Mix...
折... 从今年开始,折叠屏手机就开始火爆起来,目前已经有三星、华为、柔宇、MOTO四个品牌发布了折叠屏手机,...
数... 如果你正在思考广告的全球战略,那么一定不能忽视蓬勃发展的数字广告。移动和搜索构成了数字广告的主要部分...
G... PhotoShop,被公认为设计界软件的瑰宝。然而,设计师与 PhotoShop 有着爱恨交织的关系...
淘... 技术绝对不是淘宝运营的核心。我刚接触淘宝的时候,以为淘宝运营的核心就是技术,包括搜索流量、直通车、首...
电... 点击Shadage黑科技关注我并加★Star★最近发现我的电脑运行速度异常缓慢,每次打开网页风扇都会...
淘... 2. 每次登录淘宝 TS 时,记得领取金币。3. 点击免费使用,随机选择 1-3 个宝宝申请试用。4...
九... 手机看电影已经成为了手机使用中必不可少的一部分,如今社会生活压力大,看电影是一种享受。市面上影音软件...
快... 快速消费品行业一直是外向型孩子的首选行业相对稳定和成熟完善的晋升路径很多社会精英群体中的年轻人往往更...
国... TeamViewer、向日葵都是比较出名的远程工具,之前分享过的AnyDesk据说是TeamView...
显... 点击上方蓝色字体,选择“设为星星”关键信息,D1时间内交付!制造业的数字化转型正日益改变着世界,而显...