企业名片
  • 杭州海康威视数字技术股份有限公司
  • 主营:摄像机、考勤机/读卡器、门禁控制器、锁类、停车场系统、道闸、防盗报警主机、探测(传感)器、报警周边、可视对讲分机、门口机、可视对讲及周边、基于软件管理平台、图像处理器、图像压缩、交换/传输设备、智能布线系统、中央控制系统、系统软件、系统集成、智能控制主机、自动化控制软件、节能设备、灯光控制系统、视听设备、住宅智能安防、存储器、DVR、NVR、存储周边、车牌识别、补光设备、智能交通周边、视频编解码、智能分析、镜头
  • 地区:浙江省杭州市
  • 地址:杭州市滨江区阡陌路555号
  • 网址:www.hikvision.com
  • 认证: 企业身份认证
热门产品
企业动态

深度学习技术兴起将给安防带来什么?

2016-03-28 16:31  来源: 《中国安防》  作者: 海康威视研究院 谢迪
       神经网络、深度学习与神经生物学之间启发式的联系
       19世纪末期20世纪初从事解剖学领域研究的科学家们提出的神经元理论奠定了现代神经系统研究的基础,而这也成为了40年之后其它领域的科学家们设计神经网络模型的灵感之源。从1940年至1980年这40年间,心理学家、数学家以及计算机科学家们基于此理论(与图模型理论深度结合)不断地改进模型,使人工神经网络算法逐渐从理论探讨迈向了工程实践。具体来说,神经元理论提出的神经元和突触概念被抽象化为DAG(或者UAG)中的顶点与边,从而组成了一个完整的神经网络模型(例如多层感知机);理论提出的联结特异性原理(特定的神经元只能与另外一些特定神经元发生联系)进一步激发了诸如严格玻尔兹曼机的研究;而动态极化原理(在神经元内部信号仅向一个方向传递)则帮助人们设计出了经典的前馈神经网络结构。
       而对灵长类动物初级视觉系统的研究,人们基于视网膜上的神经节细胞只能对视场中某一特定位置产生响应(感受野)这个事实,创造性地将卷积、池化等引入了神经网络的结构中,如此简洁精妙的设计构思有效限制了由于网络结构的复杂而引起的参数爆炸性增长;同时还提高了算法的计算效率。
       其余的例子不胜枚举。神经元细胞彼此之间发生的抑制作用让神经网络(特别是深度学习)的设计者们创造出了各种技巧。视觉上的侧抑制效应则催生了局部响应归一化层的构造;而我们从ReLU、Dropout等设计上不难看出神经元细胞之间互补性控制的影子。
       深度学习算法则是基于上述事实对人脑进一步的仿生方式。人类的大脑皮层由四个区域构成:额叶、顶叶、枕叶、颞叶。神经生物学研究表明,在枕叶中存在着两条信息处理通路:腹侧通路与背侧通路,其中腹侧通路从枕叶向下延伸至颞叶下部,加工对象或场景的视觉外观,如形状、颜色、亮度、质地和大小等。进一步的研究表明,腹侧通路中,不同区域内的神经元仅对特定的视觉基元(visual primitives)产生响应。例如,V1区域对简单的边缘与纹理产生响应;V2区域对上述边缘与纹理组合形成的简单形状产生响应;而V4区域则对上述形状组合而成的更高级特征产生响应。连同将原始光信号转换为生物电信号的人眼视网膜组织,腹侧通路的这些区域形成了一条自底向上的信息处理链。信息从原始的像素开始,逐级抽象,从简单到复杂,低级到高级,形成了人类的视觉认知。打个比方,卷积神经网络好比是大脑皮层的枕叶(负责处理视觉信息),而循环神经网络则是大脑皮层的颞叶(负责处理时域信息)。
       安防监控产业与深度学习之间的联系
       现在让我们将讨论的话题切换到安防领域上来。安防监控系统是应用光纤、同轴电缆或微波在其闭合的环路内传输视频信号,并从摄像到图像显示和记录构成独立完整的系统。它能实时、形象、真实地反映被监控对象,不但极大地延长了人眼的观察距离,而且扩大了人眼的机能,它可以在恶劣的环境下代替人工进行长时间监视,让人能够看到被监视现场实际发生的一切情况,并通过录像机记录下来。同时报警系统设备对非法入侵进行报警,产生的报警信号输入报警主机,报警主机触发监控系统录像并记录。从对安防监控的描述中我们可以知道,信号的来源主要为视频和图像,换而言之主要的信号源与“视觉”相关。用通俗的话来进行描述,安防监控系统就是通过器械(摄像头等)让人们“看”到外部世界并对“感兴趣”事件产生预警的系统。
       传统的安防监控系统以“人防”为主,但人防的缺点显而易见:随着需要监控的视频通道数的增加,所需的人力也会相应增加,其直接影响就是远高于收益的人力成本与远低于回报的工作效率。正是由于这个原因,现在的安防监控系统都以“技防”为主,即用无间歇工作的智能算法来代替无法长时间保持高效的人力对视频画面进行监控。而让智能算法彻底代替人力的愿景,在深度学习出现以前,如同科幻小说一般,仅仅停留在人们的脑海中,犹如纸上谈兵,无法落地。虽然传统的智能算法能够在特定环境和特定时间下表现出良好的性能,但只要一项因子发生改变(画质、环境等),传统智能算法在应用上表现出的性能就会出现明显的下降。换句话说,传统的智能算法相比于人类的大脑,欠缺的是对于所学“知识”的迁移能力。欠缺这种能力的本质原因则需要读者对机器学习具备一定的了解:实际问题中数据的分布呈现出高度的复杂性,我们感兴趣的对象的特征往往位于嵌入在更高维度的空间中的低维流型上。流型的维度虽低,但其几何结构并不简单。更加严格地说,其超表面呈现高度的非线性性。传统的智能算法背后其实对应着传统的机器学习方法,而这些传统的机器学习方法大多被设计使用线性超曲面来近似表征数据的流型;另外一些方法则通过所谓的核技巧来进行线性到非线性的“魔法”。这些方法虽然具有很好的数学定义,有些甚至具备优雅的解析解,但“现实往往是残酷的”:数学是人们形式化用于描述自然界如何工作的途径 ,但对于人类大脑而言,目前的科技水平并没有解码其工作原理。因此,确定的、有逻辑因果联系的过程在目前看来并不适用于这个领域。