首页 大会新闻 会议日程 演讲嘉宾 参会指南 资料下载 合作单位 往届回顾 酒店预订
ENGLISH 登录报名
大会新闻
CNCC News
CNCC技术论坛 | OCR之人工智能历久弥新 时间: 2018-10-21

OCR是一个发展了超过半个世纪的课题,已经成为人工智能获得成功应用的典型范例。近几年,深度学习技术和互联网应用相结合,即对如手写识别等传统应用提出更高要求,又对以拍照和网图为特点的新应用提出需求,为OCR带来了新挑战和新机遇。

时间:2018年10月27日 下午 13:30 - 15:20 

地点:杭州国际博览中心会议区 会议室 403

OCR(光学字符识别)是一个发展了超过半个世纪的课题,见证并伴随着人工智能一起历经潮起潮落。已经成为人工智能获得成功应用的典型范例,也是识别技术创新的标准试验场。近几年,深度学习技术和互联网应用相结合,即对如手写识别等传统应用提出更高要求,又对以拍照和网图为特点的新应用提出需求,为OCR带来了新挑战和新机遇。如何把握当今OCR应用和技术的特点,更好解决具体问题。本技术论坛邀请五位分别来自研究所、高校和企业的OCR专家。一起从OCR的理论与技术,多个垂直领域的实践,现存的难点和未来重点等角度开展讨论,与大家一起坐谈OCR浪潮。

美团点评在本届计算机大会上与中国科学院自动化研究所刘成林老师、华南理工大学金连文老师、商汤科技旷章辉研究员共同举办“CNCC技术论坛|OCR之人工智能历久弥新”。下面让我们来提前一睹各位嘉宾的风采~ (文末有彩蛋哦~)

主席

刘成林

简介:研究员,工学博士。研究领域:模式识别、机器学习、神经网络、图像处理、文字识别、文档分析。现任中国科学院自动化研究所副所长,模式识别国家重点实验室主任,中国科学院大学人工智能学院副院长。

 王栋

简介:美团外卖技术部资深总监,2009年博士毕业于清华大学人工智能实验室,研究机器学习算法及计算机视觉的中层语义表示问题。毕业后先后任职于hulu及优酷,主要从事网络视频中的搜索、推荐、广告等流量变现。多次带队或参与TRECVID/KDDCUP等国际机器算法竞赛并取得第一。2011年带领团队搭建出世界上第一个实用的视频人脸标注系统。 

特邀讲者

金连文

1991年毕业于中国科技大学无线电系获学士学位,1996年于华南理工大学获博士学位。2006入选教育部新世纪优秀人才。目前为华南理工大学二级教授,博士生导师,兼任中国图像图形学学会常务理事、中国图象图形学学会“文档图像分析与识别专委会”主任、CCF计算机视觉专委会委员、CCF人机交互专委会委员等职。发表SCI期刊论文50余篇(其中ESI高引论文4篇),主流国际会议论文100余篇,获得发明专利授权43项,作为主要成员荣获省部级科技奖励5次。

演讲题目:基于深度学习的文字识别:现状及展望

摘要:文字作为信息记录、交流与传播的最重要载体,是我们感知这个世界最重要的手段,是人工智能视觉感知的一只重要的“眼睛”。在此报告中,我将简要介绍深度学习在文字识别领域的应用情况及主要技术现状,具体介绍联机及脱机手写体文字识别、场景文字检测与识别、古籍文献OCR等方面的主要研究进展及一些典型方法,并对目前存在的主要问题、技术挑战、及未来发展趋势进行讨论。 

旷章辉

商汤高级研究员,2009-2014年就读香港大学计算机系,获博士学位。 2014年6月到2015年1月,在香港联想集团任staff researcher; 2015年2月加入商汤科技,任高级研究员,负责图像视频解析与搜索研发工作,研究兴趣包括通用物体检测与识别,自然场景文字检测与识别,商品识别等。

演讲题目:Boosting up Scene Text Detectors with Guided CNN

摘要:Deep CNNs have achieved great success in text detection. Most of existing methods attempt to improve accuracy with sophisticated network design, while paying less attention on speed. In this paper, we propose a general framework for text detection called Guided CNN to achieve the two goals simultaneously. The proposed model consists of one guidance sub-network, where a guidance mask is learned from the input image itself, and one primary text detector, where every convolution and non-linear operation are conducted only in the guidance mask. The guidance sub-network ?lters out non-text regions coarsely, greatly reducing the computation complexity. At the same time, the primary text detector focuses on distinguishing between text and hard non-text regions and regressing text bounding boxes, achieving a better detection accuracy. A novel training strategy, called background-aware block-wise random synthesis, is proposed to further boost up the performance. We demonstrate that the proposed Guided CNN is not only effective but also ef?cient with two state-of-the-art methods, CTPN and EAST, as backbones. On the challenging benchmark ICDAR 2013, it speeds up CTPN by 2.9 times on average, while improving the F-measure by 1.5%. On ICDAR 2015, it speeds up EAST by 2.0 times while improving the F-measure by 1.0%. 

张睿

现任美团外卖事业部研究员。1993年和1996年于大连理工大学获学士、硕士学位,2003年于清华大学获博士学位。专注于事图像识别、机器学习等技术方向。之前曾在百度和阿里巴巴担任资深算法工程师和高级专家,在文字和文档图像识别的多个领域从事算法研发和应用实践。

演讲题目:中文文字识别从经典机器学习到深度神经网络

摘要:介绍从上次人工智能高潮以来OCR,尤其是中文OCR的发展历程,包括了基于经典机器学习和基于深度学习的算法介绍以及他们之间的关系。并分享目前中文OCR应用于产业现状及遇到的问题和一些解决方案。


中国计算机学会
电话:010-6260 0336
邮箱:cncc@ccf.org.cn
地址:北京市海淀区科学院南路6号
联系我们
参会报名:010-6260 0336
论坛、活动及会务:010-6256 2503-13
合作与展位:010-6256 2503-27
微信公众号
版权所有 中国计算机学会 技术支持:北京中科辅龙信息技术有限公司 联系电话:(86-10)62600336 京公网安备11010802017125号

京公网安备 11010802032778号