深度学习视觉解决方案

深度学习视觉解决方案

随着摄像头硬件的普及,机器视觉近几年在工业上的应用日益广泛。但传统机器视觉和基于人工智能的机器视觉有很大的不同,传统的机器视觉基本上依靠各种算子来对图像进行公式化的预处理,提取固定的模式,进行识别或定位,所以非常依赖图像的成像质量比如光照,角度,相机分辨率等等,需要大量手工编程和现场调试,而且一旦条件稍有变化就难以自动适应。而基于人工智能的机器视觉依赖深度学习强大的自动特征提取和泛化能力,不需要人工编程,可以训练计算机自动提取图像特征,同时对光照,分辨率,拍摄角度和图像畸变之类的外部条件都能自适应。这种机器视觉的实现一方面有较高的识别率和鲁棒性,一方面节省项目开发成本,在工业上的应用非常有前景

以下是一个生产铸件的场景,客户的工件表面粗糙,标记比较模糊,通过传统的图像算法无法做边缘提取或模板匹配,但人眼很容易识别:

我们尝试深度学习识别的方式。仅仅采集了几十张样本进行训练,就得到了不错的识别结果:

在安防方面对人的图像进行分析也有很大的需求,但对图片或视频中的人体进行识别和分析,在传统图像和视频处理领域一直是个很难的问题,因为人体姿态的多变性,提取特征和识别是非常困难的。深度神经网络模型很适合解决这个问题,特别是近几年训练深度神经网络技术的进步,使得解决这类问题成为现实。

我们利用深度卷积神经网络训练了一个人体关键点识别模型,输入包含一个或多个人体的图片,可以识别14个关节点: