“源于清华 服务全球”的国内顶尖OCR图文识别技术,针对视频文件里面的文字字符以及复杂背景图片的文字字符进行计算识别!
摘要:通过对视频文件里的字幕提取,达到视频文件的分类归档存储的用途;通过对网络图片里面的文字提取、监测、分析,达到舆情监控、预防谣言的进一步发展!
关键词:视频识别 视频文字识别 视频字幕识别字幕识别 新闻字幕识别 新闻关键词识别 图片文字识别 舆情监控 信息安全 网络舆情监控 谣言图片监控 OCR系统集成
北京文通科技有限公司,是中文识别的全球领导厂商,具有深厚的技术储备,OCR图文识别技术“源于清华,服务全球”。
文通视频文字识别SDK,是一套可二次集成开发的工具包,是北京文通科技有限公司针对视频文字专门开发的识别引擎,解决了目前市面上OCR产品对于媒体资源管理体系中新闻字幕识别、电影字幕识别,电视剧字幕识别,娱乐节目字幕识别等无法识别的问题。
一、文通视频文字识别SDK具有强大的文字定位功能,可以精确定位到视频中的文字位置。定位后,再对所定位文字进行识别。
◎ 支持TIFF、JPEG、PNG、BMP格式图像的读取;
◎ 可以对视频图像字幕进行自动版面分析;
◎ 能识别纯英文、简繁体中文视频图像,后续会加入少数民族语言识别;
◎ 支持对内存中的图像进行识别;
◎ 能够获取识别字符在原文中的位置和大小信息;
◎ 支持对指定区域的识别;
◎ 支持对长微博图片的文字内容识别;
二、固有的、传统的OCR识别技术产品,因为视频的文字与背景的对比度、颜色、明暗等多种因素的混淆,造成普通OCR识别算法不好或者根本无法识别,而文通视频文字识别SDK却可以有很大的改善,主要得益于清华大学新研发的计算方法来识别。这是文通视频文字识别SDK区别于一般OCR产品的地方,也是它的优势所在。
◎视频识别:集成进媒资管理系统或者其他媒体管理系统,对要管理的视频文件进行OCR识别,并把识别结果与视频关键帧相对应,这样就能实现视频的检索与利用。
三、对于舆情监控、舆情监测、信息安全等领域,也有行业内顶尖的性能。例如:分辨率较低的网页视频截图识别,网页截图识别,广告截图识别,微博截图识别等,对比其他的OCR软件,拥有非常大的优势。
◎图片识别:集成进舆情系统和维稳系统后,针对收集到的大量图片进行识别,将识别出的文字结果对比相应的监控词库字典表,例如:敏感词汇、反恐词汇等。
应用方式:集群服务器网络监控
(以上类型的图样识别率99%)
四、TH-OCR 文通视频文字识别SDK支持的开发语言 VC,VB,DEPHI等。
五、客户案例:
目前在以下两个行业领域应用比较广泛:
① 媒体资产管理领域系统集成
北京十分科技有限公司、北京网博视界科技有限公司、索贝数码、天马中视、新奥特、捷成世纪、中译语通科技(北京)有限公司、中江联合(北京)科技、济南九维数码科技有限公司、数音堂、广州思昂软件
② 舆情监控、广告监测领域系统集成
金惠科技、中国科学院信息工程研究院、河南拓普计算机网络工程有限公司、广州汇智通信技术有限公司、阳光安吉、海达数云、武汉绿网科技、活树信息科技有限公司、北京中泰安瑞科技发展有限公司
③ CCTV-13 新闻关键信息识别提取,进而推送数据给信息管理系统
④ 应用于电视台新闻节目、娱乐节目、电影字幕等文字识别需求
⑤应用于网页截屏的识别
以上是网页截图原件,以下是识别DEMO的识别结果截图(真实测试结果,识别率没有达到100%实属正常):
技术集成方面的详情讨论,可以给我来电:
任经理:(010)62800286/815/816 转 805
手机:150-1037-2383
|
北京文通科技有限公司 地址:北京海淀区北四环西路9号银谷大厦16层1609室 电话:(010) 6280 0286/815/816 转 805 传真:(010) 6280 0256
|