三维时代，真正智能——格灵深瞳重新定义安防监控 - 安防知识网

　　任何一个产业想要实现一次质的变革，都依赖于技术的单点突破与应用场景的多点开花。安防作为一个传统行业，至今已有很多年的历史。从模...

　　任何一个产业想要实现一次质的变革，都依赖于技术的单点突破与应用场景的多点开花。安防作为一个传统行业，至今已有很多年的历史。从模拟监控、数字监控、高清化/网络化监控，一直到近些年兴起的智能化监控，安防相关的技术不断成熟，应用领域不断拓宽，市场规模逐年增加，2014年安防行业总产值更是达到了4300亿元，比智能手机的市场还要大。

　　然而，对于如此庞大的一个成熟行业来说，有一些瓶颈始终无法突破，有一些问题始终无法被很好地解决。即使是宣称进入了“智能监控时代”的今天，实时性和主动性这两个很重要的功能整个行业依然无法提出切实有效的解决方案。而格灵深瞳要做的，就是解决这两大难题。

　　三维→二维→伪三维

　　物理学的基础认知告诉我们，真实世界是三维的。我们人类之所以长了两只眼睛，也是因为我们需要用三维的方式才能看懂这个世界。很多年前，学术界关于二维与三维曾经有一个争论，大部分科学家都认为计算机通过二维的静态图片就能理解图片中的场景信息，只有一小部分科学家坚持认为计算机需要获取三维信息才能理解场景中的信息。在这一小部分科学家看来，我们人类的大脑如此聪明，尚且需要用两只眼睛才能看得懂眼前的场景，计算机是不可能用二维的图片完全理解场景信息的。至于孰对孰错，需要时间来进行验证。

　　多年来，整个视频监控行业采用的都是基于二维的图像处理技术。“智能分析”这个词近些年在安防行业很是火爆，一开始大家都对此寄予了很高的期待。但是随着该技术的大规模使用，大家发现所谓的“智能分析”其实是伪智能，各种误报、漏报以及错误识别，让一线安保人员很是头疼。其实细究下来，现在市面上的所有智能分析系统都是先将三维场景转化成二维的静态图片，然后利用一些先进的算法对二维信息进行优化，使图片信息达到伪三维的层次，系统借此判断物体大小、距离等信息。但是算法终归是算法，即使优化到极致，它还是会有缺陷。

　　三维的世界在转化为二维图片的过程中，丢失了“深度”这一重要的维度信息，使得计算机很难判断物体的大小、距离、速度等信息，这种缺陷为安防行业带来了巨大的隐患。全世界每天都有各种暴力事件发生，但是几乎所有的安防系统都是后知后觉的，既不能在第一时间发现犯罪分子的危险行为，也不能在事后调查取证过程中做到快速高效。

　　真三维，真智能

　　有一句话说得好：真理往往掌握在少数人手中。时至今日，越来越多的科学家意识到二维图像识别即使优化到极限，也很难对场景中物体的绝对尺度、影子等进行精确测量与识别。

　　三维的世界，只能用三维的方式去理解。

　　格灵深瞳正在做的，就是用三维计算机视觉技术处理三维视觉传感器获取的三维场景信息，结合深度学习，实时而精确地实现对人的检测、跟踪和识别。

　　三维视觉传感器是一种能够实时捕捉场景三维结构信息的传感器。这种传感器不间断地向环境发射经过特殊编码调制的红外信号，这些红外信号投射在场景物体的表面后折返回到传感器时，它们所携带的场景三维结构信息，经过解码在传感器内被精确地重建。

　　格灵深瞳现在所使用的三维视觉传感器，每30毫秒就从空间获得多达30多万个三维点位信息。每个点位不仅仅包含空间三维位置，也包含该位置物体的色彩信息。

　　三维视觉传感器使得精确度极高的智能分析成为可能，相比起传统的二维技术，三维视觉传感器在智能分析上拥有巨大的优势。格灵深瞳基于自主研发的深瞳TM技术推出的首款产品——皓目行为分析仪重新定义了安防监控，它突破了传统二维图像处理方法的限制，基于RGBD数据，利用运动在时空的连续性等线索，实时而精确地实现对人的检测、追踪和识别。与此同时，它还将视频数据结构化，通过精准搜索实现事件的快速查找与定位。在此基础之上，我们能够判断分析自定义的行为特征，并进行更精确的人体骨架关节点定位。另外，我们在更大的时间和空间尺度，分析人群的行为模式，挖掘潜在的规律和商业价值。

　　深瞳TM技术

　　三维计算机视觉

　　采用革命性的三维视觉传感器和三维视觉算法，实时捕捉和分析场景的三维信息，解决了传统二维图像中相互遮挡、影随人动、比例混淆的问题，使得更高精确度和复杂度的智能分析成为现实。

　　深度学习

　　灵感来源于人脑的工作机制，通过类似脑神经网络的深度学习模型，让计算机像人一样在真实世界中吸收、学习和理解复杂的信息，完成高难度的识别任务。

　　基于深瞳TM技术，格灵深瞳主要做两个方向，一个是人，一个是车。以下是两个方向的产品介绍。

　　皓目行为分析仪

　　皓目行为分析仪具有三维分析、精准搜索、智能轮巡、开放平台四大功能。

　　三维分析——三维视觉传感器每30毫米获得30多万个三维点位信息，构建真实三维场景，让计算机能够理解并分析复杂场景下人的行动和行为。

　　精准搜索——结构化事件信息，事后可以通过精准搜索实现事件的快速查找与定位。

　　智能轮巡——实时推送异常事件，以智能轮巡的方式进行同屏显示，避免大量无用视频信息干扰，极大增加了危险事件被识别的几率。

　　开放平台——事件以API方式输出，可接入客户现有平台，还可使用人员轨迹信息二次开发自定义事件，视频支持ONVIF协议，可与现有NVR对接。

　　相比于传统的二维产品，皓目行为分析仪具有其独特的优势。

　　1. 检测跟踪

　　精确检测复杂场景多个目标，首款跟踪40+人的行为分析仪

　　传统的二维技术都是借助对人员特征的模式识别进行目标检测，无法对人员进行尺度测量，且受光影和遮挡的影响很大，在拥挤的场景中容易导致大量的检测失败，无法对轨迹进行跟踪。深瞳TM技术可以通过红外激光获取三维空间数据，对人员进行绝对尺度测量，如位置、身高、距离、速度以及加速度，通过叠加二维信息可以得到更丰富的体貌特征;可以适应光线变化，在非常拥挤复杂的场景中精准检测人员并对每个个体进行持续跟踪。

　　2. 动作姿态

　　三维构建人体动作姿态，首款可主动交互的行为分析仪

　　传统的二维技术主要通过二维像素变化的剧烈程度来判断异常行为，当场景变化复杂时会引发大量的误报。人体的三维空间数据能够反映其动作姿态，深瞳TM技术通过躯干和四肢的运动状态检测异常行为，如人员倒地或剧烈动作等，还可定义特殊动作与行为分析仪进行主动交互，如呼救检测和人员签到。

　　3. 深度标记

　　虚拟锁定空间状态，首款可对重点物品设防的行为分析仪

　　传统的二维技术通过像素的变化来判断物体状态，当发生遮挡或者光线变化时，会引发大量的误报。深瞳TM技术对三维空间中的任何区域均可进行虚拟锁定，并检测其数据变化情况，即使发生遮挡，或者光线剧烈变化，锁定依然有效。

　　4. 区域划分

　　自由划分立体区域，首款不受遮挡影响免标记的行为分析仪

　　传统的二维技术在二维图像坐标中定义热点区域，当物体在图像坐标中遮挡设定区域，但并未在真实空间中进入区域时，会引发大量误报。虽然通过标记能够在一定程度上获得尺度数据，但是配置过程复杂且精度低，可用性不强。深瞳TM技术由于拥有三维空间的检测能力，用户可精确定义空间热点区域，只有当物体在三维空间中入侵这些区域时才会触发检测，有效地避免因遮挡引发的误报。另外，结合人员轨迹我们能够得到准确的人数统计数据，并且所有配置均基于三维空间，不需要任何尺度标记。

　　5. 镜头状态

　　实时监控三维背景变化，首款可预防视觉欺骗的行为分析仪

　　传统的二维技术通过像素分析检测背景变化，无法区分遮挡和光线变化的不同，使用与场景一致的图片遮挡设备无法被检测。皓目行为分析仪通过三维背景和二维图像相结合的背景变化检测，能够区分遮挡和光线变化的不同，使用与场景完全一致的图片遮挡设备依然能被准确检测。

　　格灵深瞳自主研发的皓目行为分析仪在各行各业都充满了巨大的想象力，包括金融领域、零售领域、司法领域、博物馆领域等。

　　除了皓目行为分析仪以外，格灵深瞳还将在此次安博会上展示威目车辆特征分析系列产品。

　　威目车辆特征分析系列产品

　　威目车辆特征分析系列产品致力于提供基于深度学习的新一代车辆深度识别引擎，以在线云服务/离线 SDK /软硬一体的产品形式，让企业级用户和直接业务部门可以快速应用最好的车辆识别技术。

　　相较于市面上的其他车辆特征识别产品，威目车辆特征分析系列产品具有如下六大优势。

　　车款识别—— 可识别2000多种车款，白天识别率>90%，夜间识别率>85%

　　车型识别—— 可识别16种细分车型，白天识别率>95%，夜间识别率>90%

　　车身颜色识别—— 可识别12种颜色，白天识别率>90%，夜间识别率>80%

　　标志物检测——检测率>85%，可检测年检标、遮阳板、纸巾盒、挂件等