第A08版:海聚英才

上一版   

 

2022年01月10日 星期一

 
 

放大  缩小  默认   

 

张江青年创业者陈运文赋能企业数字化转型

打造“会撰写”的人工智能产品

青年报记者 陈晓颖

    陈运文用智能文本算法为新时代需求赋能。青年报记者 吴恺 摄

“任意摘取一段新闻,人工智能平台就能根据语意、词性拆解。仅需要按一键,就可以分别智能生成300字、600字、800字的文章。我们正在通过人工智能,让数据‘多跑路’。”在位于张江的达而观信息科技(上海)有限公司办公室,陈运文用一个简单的示例介绍着他所运维的文本智能处理事业。从2015年创办企业,到如今为百余家知名企业、单位提供人工智能支持,让银行、证券从业者从繁杂报表归纳中解脱出来,陈运文用基础人工智能技术,在张江扎根,在上海成长,用智能文本算法为新时代需求赋能。

青年报记者 陈晓颖

人物名片

陈运文,达而观信息科技(上海)有限公司创始人及董事长,复旦大学计算机专业博士,主攻计算机阅读理解文字板块,曾获“中国青年创业奖”、“创新创业好青年”、上海市五四青年奖章、浦东新区十大杰出青年、上海市优秀技术带头人等称号。

突破技术壁垒

开拓文本智能应用场景

中文因语意结构、文字理解场景较为复杂,想要做好中文的人工智能识别,可不是一件容易的事。在人工智能算法领域,要实现计算机会“读书”、会“写文章”,需要用文字处理领域的特定算法“教”会计算机“识文断字”。

“我们的目标就是通过计算机处理,将人们从日常繁琐的文字工作中解放出来,完成更多脑力工作。”纸上谈来终觉浅,陈运文以自己的名字为例生动解释了这一“教学法”的实际应用——他先让计算机熟读百家姓,当计算机再次识别到“陈”字时,就知道“陈”可能是一个姓。通过持续“喂食”大量中文文本,计算机结合统计学方法检索匹配到人名搭配的词语,最终将“陈运文”三个汉字识别为一个名字。陈运文说:“古人常说读书破万卷,下笔如有神,我们发现,这句话对计算机非常适用。”听起来简单的“字词句段篇”学习方法,实际上需要极强的技术支持。

陈运文正是此项技术领域的深耕者。自复旦大学计算机博士毕业后,陈运文就进入科技网络公司百度。2010年因对研发新项目的浓厚兴趣选择加入盛大创新院,带领技术团队研究新的领域——文本智能处理。5年后,觉得时机成熟的陈运文决定带领团队独立创业,公司地址定于盛大创新院的所在地——张江。

创业路上,技术难题易攻,市场接受度这一难题却较难突破。在大数据概念兴起之初,陈运文便留意到部分企业缺少数据处理经验,无法有效解码数据信息,也无法在生产经营过程中应用数据。银行、证券、法律等都是文本密集的行业,招股说明书、债券募集说明书或者合同,处理这些规则明确的文本,内容枯燥又耗费时间。“文本智能自动化的产品引进到企业,让其协助员工工作,既能减轻员工负担,又能提高企业效率。”“技术咖”与“创业者”并存的陈运文在创业初期就将目标瞄准 B 端市场,多年创业经历印证,这条路选对了。

延展智能办公

让人工智能按流程“多跑路”

汉字经过五千多年的演变,形成许多约定俗成的讲法,让计算机去理解中文背后博大精深的意义绝非易事,必须投入更多技术。陈运文希望能够将自主研发的中文资料自动化处理技术应用到更广泛的领域,服务更多人群。

在训练人工智能更智能的过程中,团队通过“感知-决策-执行”的链条,不断应用最前沿的人工智能研究成果,形成自然语言处理技术、光学字符识别、知识图谱和机器人流程自动化四大能力。如今拥有文本智能办公机器人完整产品线的达观数据靠着实打实的技术支撑在2018年获得我国人工智能领域含金量极高的“吴文俊人工智能科学技术奖”,2021年获得工信部专精特新小巨人企业。

“让所有企业都拥有自己的智能办公机器人”这一企业愿景已在征途。如今,达观已为中国银行、深交所等几百家企业提供语义理解人工智能产品。

新冠肺炎疫情期间,陈运文还带领公司紧急开发了防疫问卷机器人、材料预审机器人、数据填报机器人、数据查询机器人,用人工智能手段助力企业人员每日健康信息的自动化采集、汇总、记录与报送,帮助各大企业复工复产。

注重人才培养

500人团队持续优化AI技术

达观数据从注册成立之日起就定位在张江。在自贸区,大学生创业基金会浦东分基金会的支持、自贸区宽松的创业环境及鼓励企业创新创业的机制,为公司人才培养提供了极大便利。目前,公司已与北京大学、复旦大学、上海交通大学、上海财经大学等高校建立文本挖掘联合研究实验室和产学研合作,让更多青年优质苗子可以在学中练,在项目中提升人工智能应用水平。

重视人才培养是一家科技型企业发展的重要一环。“公司最核心、最宝贵的资产就是员工,尤其是尖端的工程师。”陈运文介绍,工程师团队主要由来自腾讯、盛大、百度、阿里等知名企业高管和技术专家组成。技术积累深厚的团队申请了百余项发明专利。“创业初期,也有候选员工看到我们是初创企业,犹豫再三后选择其他大型公司的offer。”每次陈运文遇到“好苗子”,都无比惜才。有次在得知一位候选人放弃选择达观后,他通过电话与候选人多聊了一会,谈技术、谈人工智能未来发展。“陈总,我决定加入你们。”这位员工最终选择为梦想创业,也成为陪伴达观数据成长的核心骨干,共同在人工智能专业技术领域深耕发展。

如今已有500人左右规模的达观,在自主开发钻研自然语言处理(NLP)、光学字符识别(OCR)、知识图谱等前沿技术方面持续突破。

陈运文时常感叹:“文字这个东西,越做越有意思。”谈到未来,他坦言达观数据仍需努力——“我们立足上海,目前已将公司产品推广到全国各个省市。我们预计在自贸区环境中将企业做大做强,争取早日上市,成为上海人工智能大数据企业的一面旗帜。”

青年寄语

在智能文本的世界里,创新创造永无止境。

 

 

青年报