cv是什么 计算机行业cv是什么( 二 )


看到 AlphaZero 的显著成果,人们不禁要问:我们能否将它在国际象棋领域的成功应用到计算机视觉领域?
以数据为中心的人工智能
以数据为中心的人工智能的目的不是创造更好的算法,而是通过改变数据本身来提高模型性能 。即使我们不考虑获取和标注图像数据集的困难,数据的质量问题仍然存在:数据是否覆盖了所有可能的情况?是否覆盖边界情况?
如果我们要构建以数据为中心的计算机视觉,就必须控制数据的来源 。为了让计算机视觉模型更好地学习和理解参数,就必须保证数据的平衡 。
比如,我们想要控制三个参数:相机的角度、光照和遮挡 。当你收集这样的真实数据集时,必须努力控制这 3 个参数的值,同时收集 1000 张相关图像 。但有了这些真实数据,任务还是非常艰巨 。
过去的 5 年中,我们在优化数据收集过程和提高数据标签质量方面,取得了巨大的进展 。而且还会使用各种数据增强技术,来充分利用数据集信息 。比如将数据集中的图像应用一些数学函数,以创造更多样的数据 。
目前,有 400 多家公司的总市值达到 1.3 万亿美元(略高于 Facebook),满足了如今算法对数据的需求 。
但是,这些方法最终是否会走进死胡同?算法是否已经在人类数据集上达到了极限?就像我们在国际象棋中使用人类数据作为算法输入一样,模型会受到数据集设计的限制,而无法超越人类 。
在国际象棋中,如果我们停止构建人类数据,并允许机器构建自己的数据来优化学习过程,后深度学习就能有所突破 。在计算机视觉中,我们也必须允许机器自主生成可以促进它们学习的数据 。
CV未来:合成计算机视觉
通过虚拟现实引擎,可以更好地创建训练数据 。在准确率方面,模型的输出已经达到了现实世界的标准 。意味着可以通过模型生成智能化的数据,来指导计算机视觉模型的学习 。这种合成数据可以成为以数据为中心的人工智能框架的基础 。
因此,我认为,现在需要广泛使用视觉合成数据 。

  • 虚拟现实引擎有专门的生成合成数据的组件(比如 NVIDIA IsaacSim,Unity Perception),这些合成数据不仅美观,而且有助于训练更好的算法 。
  • 3D 功能正迅速成为一种必需品——最新的 iPhone 手机就配备了激光雷达(LiDAR)和用于 3D 扫描的应用程序,来达到更好的性能 。
  • 元宇宙(Metaverse)的时代即将开始 。人们将会渐渐习惯生活在虚拟现实的世界中 。比如未来的宝马制造厂和谷歌的孪生供应链,就会应用到数字孪生技术 。
  • 行业的领头者已经开始使用虚拟现实技术来改进计算机视觉算法:特斯拉(Tesla)就在利用虚拟现实技术来生成驾驶场景的边缘情况和更多的新视角 。
如果我们有合适的工具来构建数据集,就可以省去繁琐的给数据手工打标的过程,更好地对计算机视觉算法进行开发和训练 。Gartner 认为在未来 3 年中,合成数据将比真实数据更占优势 。
如果往前再进一步呢?进入一个不需要人类对图像打标的计算机视觉的世界 。
通过合成计算机视觉,我们可以在虚拟现实中构建模型,并在现实世界中进行部署 。就像国际象棋比赛中,AlphaZero 可以自己学习重要的部分,所以我们用算法来决定模型需要重点学习的内容,以达到最佳的学习效果 。
在合成计算机视觉(SCV)中,我们使用虚拟现实引擎训练计算机视觉模型,并将训练好的模型部署到现实世界 。
人眼能看到的东西远不如现实世界丰富,所以我们构建的算法只能到人类理解和标记出的信息范围内 。但事实可能并不是那样,所以我们可以为传感器构建算法,来测量超越人类感知范围的东西 。这些算法可以在虚拟现实中通过编程的方式进行有效训练 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: