欧冠

机器视觉是卷积神经网络架构的深度学习适用略

2020-10-16 04:05:36来源:励志吧0次阅读

机器视觉是卷积神经网络架构的深度学习,适用于精确目标定位

机器视觉是工业4.0,即工业物联网背景下高度自动化和无缝联网进程的关键技术。使用诸如深度学习之类的新的人工智能进程变得越来越重要。许多好处使这项技术具有吸引力,但同时它也有局限性。工业生产的自动化正在迅速发展。完全网络化和数字化的流程链在生产车间早已习以为常。在工业4.0和智能工厂中,所有触及的组件——包括机器、机器人、传输和处理系统、传感器和图象收集设备——一起工作,彼此无缝通讯。机器人领域也出现了一种新趋势:小型、紧凑的移动机器人,即协作机器人(collaborative robots, cobots)正在加入生产流程,并常常与人类同事密切合作。cobots的最大好处是,它们可以快速地重新装备,并且只需很少的工作,这使得灵活地使用它们来完成不同的生产任务成为可能。

伴随并支持全部价值创建进程的互补技术在这些高度自动化的场景中扮演侧重要的角色。这些包括,例如,可编程逻辑控制器(plc)和机器视觉。后者作为“生产之眼”实时视察和监控生产过程。图像搜集设备,如相机、扫描仪和3D传感器,被放置在多个位置,并从不同的角度记录进程。生成的数字图像数据通过集成的机器视觉软件进行处理,可用于处理链中的各种任务。例如,可以根据光学特性可靠地检测目标并精确定位。该技术还可以检测产品的制造故障,从而自动排除故障,从而优化质量保证流程。

基于卷积神经网络(CNNs)架构的深度学习

越来越多的先进人工智能(AI)技术被纳入机器视觉系统。其中一项技术是基于卷积神经网络(CNN)体系结构的深度学习。大量的数字图像信息用于广泛的培训进程。基于这些数据,软件可以独立地对新对象进行分类。在训练进程中,自动学习特定对象类的特点。因此,新的图象数据可以精确地分配给它们的特定种别,从而产生非常高和强大的识别率。这些深度学习算法也适用于精确目标 定位 和缺点辨认。

机器视觉是“生产之眼”

深度学习技术注定要在机器视觉应用程序的某些领域使用。这些主要包括分类、对象检测和语义分割。这就是智能算法的优势所在。但是,在其他机器视觉应用中,深度学习的适用性有一定的局限性。由于需要分析大量的数据,训练进程通常需要非常大的计算能力和适当尺寸的硬件。特别是在时间非常关键的应用程序中,标准CPU以至于每个从事时尚门店店面设计的人通常是不够的。不适用于高速应用程序,例如高精度丈量任务和具有毫米或微米精度的目标定位。在这种情况下,深度学习算法在一个标准CPU上需要50到100毫秒。但是,这种精确定位只需要几毫秒。这里需要的是一个功能强大的GPU, 通常 GPU是不适用于工业用途的硬件。

深度学习并不是适用于所有应用

在工业运用中,深度学习也不是最好选择,例如在电子和半导体工业中,要检测或辨认的对象与实际情况非常类似。由于这些组件通常具有非常类似的外观,因此使用传统机器视觉方法进行培训只需要几个示例图像。在许多情况下,即便是单个图像也足以可靠地检测到对象并精确定位它们。但是,只有当每个对象最少有100个训练图像可用时,使用深度学习算法才有意义。因此,使用常规方法(如基于规则的软件技术)可以更好地解决机器视觉任务,其中要辨认的对象非常类似。特别是对读取数据代码和条形码,采取启发式算法而不是深度学习算法。对目标的度量,如亚像素精确轮廓提取,也依赖于启发式算法。

深度学习可以提高识别率

但是,在深度学习能够带来全部好处的应用中,必须斟酌某些挑战。深度学习是一种相对较新的技术,市场对其提供的通用标准很少。另外,深度学习的整体处理非常复杂,需要深入的知识和在人工智能、编程和机器视觉领域的多年经验。这通常超越了一般公司的能力,由于他们缺少必要的专业人才。

通过预先培训的深度学习网络减少工作量

但是,有些公司可以通过公道的努力从深度学习中获益。例如,他们可以利用预先培训的深度学习网络。为此,市场上提供了许多免费的开源解决方案。不过,使用它们还是有一些骗局。例如,可能会出现许可证问题。通常需要几十万个样本图象来精确辨认物体。之所以需要如此多的特点,是由于许多不同的特点,如色采、形状、纹理和表面结构,对辨认进程至关重要。在选择如此大量的图像时,确保它们不受开源产品很少保证的第三方权利的束缚是很重要的。

使用开源工具的另一个挑战是,它们通常只单独实行某些机器视觉任务,很难集成到其他应用程序或现有框架中。典型的机器视觉问题通常触及几个步骤。首先,必须将来自图像搜集装备的数字图像数据提供给特定应用程序。然后在第二个步骤中对数据进行预处理,在该步骤中,图像被优化定向以将对象放置在所需的位置。最后,处理后的数据被集成到其他解决方案中,例如PLC,这样就可以无缝地将结果用于其他流程步骤。这就是开源系统到达其极限的地方。

标准专有软件有很多优点

已具有预先培训的网络的专有标准软件解决方案是机器视觉的更实用的选择。这些解决方案包括配备培训深度学习网络的所有重要功能的软件。基于其广泛的功能和专门配置的工具,它可以最好地集成到其他应用程序中。该解决方案包括多个网络,这些网络已根据工业环境中大约一百万个精心挑选的免许可证图像进行了预先培训。公司只需要一些额外的图象就可以根据自己的特定运用定制网络培训流程。这大大减少了培训工作,节省了资金,并避免了与图象权利相干的风险。

通过深度学习,可以精确地检测物体。图像来源:MVTec Software GmbH

使用开源工具是另一个挑战。深度学习应用程序通常包括数十万行编程代码。要正确操作,此代码必须满足某些质量标准。使用一个未知社区开发的开源代码会在这方面产生一定的风险。为了安全起见,公司需要在内部检查代码以肯定其质量。由于大量的代码,这项任务非常劳动密集,并且产生了几近没法计算的本钱。但是,使用专有的商业解决方案,公司可以从高质量、经过测试和安全的代码中获益。如果需要支持的话,专业顾问和专家是可以利用的,这在开放的社区中是不可期望的。

在数字化时期和工业物联网时期,机器视觉是高度自动化和网络化生产过程中不可或缺的伴随技术。 基于AI的技术,如深度学习和CNN,是这些机器视觉解决方案的重要组成部分。 但是,请务必记住它们仅适用于某些应用程序。 公司还应当仔细推敲开源系统是不是足以满足他们的要求,或是不是值得花时间投资商业的专有软件解决方案。

文章来源:新机器视觉

一岁宝宝不消化怎么办
亚宝药业薏芽健脾凝胶
防过敏奶粉排行榜
小儿积食什么原因
分享到:
  • 友情链接
  • 合作伙伴