(数据来源:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4)
PASCAL VOC目标检测任务囊括了车、人、猫、狗等20类常见目标。训练样本较少、场景变化多端,非常具有挑战性。提到夺冠之道,海康威视研究院常务副院长浦世亮
表示:“我们的预研团队基于Faster R-CNN深度学习目标检测算法,通过调整网络结构、上下文建模、优化训练和预测等策略,大幅提升了检测性能。研究成果可以应用到视频监控的车辆检测、车牌识别、人体检测、人体属性分析、视频结构化等产品中,将大幅提升产品性能与应用效果。长远来看,在智能安全监控、汽车辅助驾驶、智能交通感知、视频语义理解、机器人和无人机等各方面都有着巨大的应用价值。”
PASCAL VOC可谓视觉识别类竞赛的鼻祖,是由利兹大学、苏黎世联邦理工学院、爱丁堡大学、微软、牛津大学等组织的一个视觉识别竞赛,包含了物体分类、目标检测、图像分割等任务。PASCAL VOC对计算机视觉的发展具有深远而巨大的影响,后续的ImageNet竞赛的任务设置就基本沿用了它的设定。此前,微软、英特尔、CMU、Facebook、UC Berkeley等国际顶尖研发团队先后在这个排行榜上刷新纪录。
海康威视研究院由智能分析、大数据技术、感知技术和多媒体技术等专业团队组成,突出在音视频技术的专注和积累,着重研究视音频的智能算法、大数据的分析、挖掘和计算,同时针对新的图像传感器等感知技术,视频的播放技术,人机交互等多媒体技术进行深入研究。目前在海康威视研究院众多领域的研究都走在行业前列,2015年,海康威视研究院在KITTI的评测中,车辆检测和车头朝向估计两项任务评分均排名世界第一;在MOT Challenge算法测评中获得“计算机视觉的多目标跟踪算法”世界第一;名列TRECVID2016 SED第二名、PASCAL VOC 2012图像分割任务第二名。