图像识别技术在安防领域的应用研究
近一两年来,人工智能领域得到了媒体界、产业界和学术界等前所未有的关注,机器正在越来越多的取代人类特有的优势和技能,这其中最为重要的可能就是图像识别技术。本文将从图像识别技术的原理阐述出发,介绍这一技术在安防行业的具体应用,并且阐述其在当前安防应用上碰到的困难。当然,面对这些困难,图像识别技术将以此为契机,与安防技术实现更大范围的融合与发展。
图像识别技术与人工智能
说起图像识别,人类的这一能力非常突出。图形**作用于感觉器官,人们辨认出它是经验过的某一图形,甚至能感知到与图像距离或者形状的改变,这一过程叫做图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程,才能实现对图像的再认。
计算机图像识别技术,则是利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术。图像识别所研究的问题,是如何用计算机代替人类去自动处理大量的物理信息,解决人类所无法识别或者识别过于耗费资源的问题,从而很大程度上解放人类的劳动力。
图像识别技术是人工智能的一个重要领域。图像识别技术是以图像的主要特征为基础的。每个图像都有它的特征,对图像识别时眼动的研究表明,视线总是集中在图像的主要特征上,也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方,这些地方的信息量最大。而且眼睛的扫描路线也总是依次从一个特征转到另一个特征上。由此可见,在图像识别过程中,知觉机制必须排除输入的多余信息,抽出关键的信息。同时,在大脑里必定有一个负责整合信息的机制,它能把分阶段获得的信息整理成一个完整的知觉映象。
为了编制模拟人类图像识别活动的计算机程序,人们提出了不同的图像识别模型。例如模板匹配模型。这种模型认为,识别某个图像,必须在过去的经验中有这个图像的记忆模式,又叫模板。当前的**如果能与大脑中的模板相匹配,这个图像也就被识别了。但这种模型强调图像必须与脑中的模板完全符合才能加以识别,有一定的局限性。格式塔心理学家又据此提出了一个原型匹配模型。这种模型认为,在长时记忆中存储的并不是所要识别的无数个模板,而是图像的某些“相似性”。从图像中抽象出来的“相似性”就可作为原型,拿它来检验所要识别的图像。如果能找到一个相似的原型,这个图像也就被识别了。但是,这种模型没有说明人是怎样对相似的刺激进行辨别和加工的,它也难以在计算机程序中得到实现。因此又有人提出了一个更复杂的模型,即“泛魔”识别模型。
随着计算机技术及人工智能技术的发展,图像识别技术越来越成为人工智能的基础技术,它将是未来科技领域几大关键产业的核心技术之一。微软、谷歌、Facebook、亚马逊、百度、腾讯等巨头都在倾注大量资源推动这项功能进步。比如微软的图像识别应用“我看起来有多大”(HowOldDoILook?),成为网络上红极一时的话题。在去年举行的第六届ImageNet图像识别技术比赛中,微软凭借“图像识别的深度残差学习”(DeepResidualLearningforImageRecognition)系统获得第一名。科技公司如此热衷于图像识别技术的应用和创新,这种进步显然会大大方便互联网、传媒行业及科研领域的相关工作。
图像识别技术与安防技术的融合
现在,图像识别技术的应用范围已经远远突破视觉的范围,而更多地体现为机器智能、数字技术的特点。可以说,图像识别技术就是人类视觉认知的延伸。
视频监控在过去的实际应用中,面临的最大问题就是必须由人工查看视频。视频智能分析技术正是为解决这一问题而生,它通过对视频进行智能分析、有效信息的结构化数据提取,从而让视频监控的使用者真正告别人工安防而走进自动化安防的新时代。
目前视频智能分析主要有两种产品形态:前端智能和后端智能。前端智能以科达感知型摄像机为代表,将智能分析算法嵌入到前端摄像机,前端摄像机对采集的视频内容立即进行分析,提取出画面中关键的、感兴趣的、有效的信息,形成结构化的数据,将后端感兴趣的内容实时传给后端做存储或深入分析。后端智能是前端摄像机只负责采集视频图像,将码流传递到后端服务器做集中处理。这样对于后端的计算压力比较大,也不利于实时处理。更合理的方式是前端摄像机进行基础的结构化数据提取,后端服务器再进行深度二次分析;也就是说,将前端和后端配合起来做智能分析,才真正让视频图像智能分析实现最大化价值。
视频监控领域是图像识别技术一直在寻求突破的主要领域之一。视频智能分析技术目前在公安、交通、零售、司法、教育等行业都获得了普及性应用。
公安
公安行业借助智能视频分析主要用于实现城市道路、广场及各类重点场所的人、车、物等目标的识别,提取包括人的性别、人脸、全身等信息,车的车标、车牌、车身颜色等信息,这些信息均可提炼为计算机能识别的结构化数据,送入后端进行专业的安全管理应用,主要包括实时布控、高危人员比对、以图搜图、多点碰撞、语义搜索等方面。
交通
具有分析、感知能力的智能摄像机通过视频识别分析技术,可对每辆车进行完整的违法行为分析、识别、抓拍和录像,记录车辆违法的整个过程,再将每条记录生成非结构化的视频、照片数据和结构化的文本数据提交给后端智能管理与分析系统,由系统进行高度智能的交通违法行为处理。基于智能视频分析技术,智能交通管理系统还能得出不同品牌的车型拥有量、过车高峰期、车辆进出城高峰期及行驶方向等丰富的交通数据,为城市交通流量管控、交通道路规划等提供详实的数据支撑。
零售
视频智能分析在零售门店视频监控方面的领先应用,是科达为联合利华门店建设的热点统计系统,系统通过感知型摄像机和后端的大数据分析平台相配合,用于开展个人护理类商品陈列和货架布局的顾客行为数据收集及分析,比如顾客在不同商品前的停留时间是多少、商品陈列和货架布局调整前后的人流动向对比和购买金额对比等,进而作为最终的经营决策参考。这一系统不仅创新了视频监控系统远程管理零售门店的应用,更为连锁零售行业如何通过视频监控系统开展消费数据比对、分析等大数据应用开创了有益启示。
司法和教育
在监狱和看守所,视频智能分析技术更是较早得到了运用。除传统的智能分析技术应用之外,感知型摄像机也被用在AB门等出入口,用于对所有过往人员进行脸部和全身的图像采集,同时提供结构化和半结构化数据给后端管理平台,平台对人员进行实时比对,用于有效杜绝非法出入。学校采用视频智能分析技术可以开展安全管理和教育录播两种应用,后者通过教室内的智能跟踪摄像机自动识别、跟踪老师的运动图像,同时对视频和声音进行记录,再生成录播课程。
应该说,图像识别技术对于整个安防方案来说都是一项艰巨而又关键的任务,直接决定了后续图像处理与分析的准确性和便捷性。在视频监控领域,图像识别技术正面临着不小的挑战,具体可阐释为:其一,对图像质量的要求越来越高,图像识别与处理的算法也越来越复杂;其二,对图像的实时性处理和传输要求越来越高;其三,图像识别的算法更加个性化,也更加成为市场竞争力的关键所在;其四,图像数据往往涉及隐私,因此也需要提供可以信任的安全保证。面对这些挑战,科达深知要使图像识别技术与安防技术实现更好的融合,任重而道远。尽管在业界已经拥有了一定的知名度,科达仍然深耕于安防行业,把感知型摄像机视为视频监控的未来,在将图像识别技术更好地应用于具体的行业需求方面,为其他人工智能的应用提供了一条有价值的参考路径。