Dublin City University 刘群教授来我院做学术报告

发布日期:2016-05-19 浏览次数: [字体: ]

 

2016518下午3点半,应计算机学院和江苏省信息安全工程研究中心邀请,中国科学院计算技术研究所研究员,都柏林城市大学(Dublin City University)刘群教授在明理楼(S2)-109做学术报告。刘群教授的报告题为“ A Novel Approach to Dropped Pronoun Translation”。报告会由计算机学院院长吉根林教授主持,我院部分教师和研究生聆听了整场报告。
刘群教授,中国科学院计算技术研究所研究员,都柏林城市大学(Dublin City University)教授及爱尔兰ADAPT(原CNGL)研究中心自然语言处理主题负责人。研究方向是自然语言处理和机器翻译,尤其是中文信息处理、统计机器翻译模型与方法等。1989年毕业于中国科学技术大学计算机系,1992年于中国科学院计算技术研究所获得硕士学位,2004年于北京大学获得博士学位。他领导研制的ICTCLAS开源系统是应用最广泛的中文词语切分和词性标注工具。该项成果获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖。他领导的研究组在基于句法的机器翻译领域开展了长期的研究工作,其中代表性成果包括树到串模型、最大熵转录语法模型、基于森林的机器翻译方法等。相关研究工作在领域顶级会议和学术期刊上发表30余篇论文,相关成果获得了北京市科学技术二等奖和国家科技进步二等奖,并授权给很多企业推广应用,包括华为、阿里、三星、微软等。他组织承担和重点参与了国家自然科学基金、八六三计划、爱尔兰国家科学基金会、欧盟第七框架和H2020框架等众多大型科学研究项目。培养硕士博士研究生40余人,很多学生已成为自然语言处理和机器翻译领域的活跃研究人员和一些大型互联网企业的相关研究开发部门负责人。
Dropped Pronouns (DP) are challenge in machine translation in which pronouns are frequently dropped in the source language but should be retained in the target language. In response to this problem, we propose a semi-supervised approach to recall possibly missing pronouns in the translation. Firstly, we build training data for DP generation in which the DPs are automatically labelled according to the alignment information from a parallel corpus. Secondly, we build a deep learning-based DP generator for input sentences in decoding when no corresponding references exist. Experimental results show that our approach achieves a significant improvement of 1.58 BLEU points in translation performance with 66% F-score for DP generation accuracy.
刘教授的报告首先介绍了机器翻译中的代词缺失问题及其解决的方法和模型,然后介绍了机器翻译中的对话翻译的相关工作,最后介绍了数字内容研究中心(ADAPT Centre)和他本人的研究课题和科研成果。
刘教授的报告高屋建瓴、鞭辟入里、深入浅出,活跃了学术气氛,开阔了师生的视野。学术报告会在热烈的掌声中圆满结束。