中心概况

 

 
汉语信息处理研究室

 

 

 主任:    黄笑山  教授
 专职研究人员:   陈忠敏 教授
 兼职研究人员:   周昌乐  教授
 
  本中心的研究领域覆盖汉语言文字学、中国古典文献学、计算机科学等几个博士点,有利于各种知识的交汇融合,有利于古今汉语的沟通。汉语信息处理研究室从事于计算机汉语信息处理和语料库建设。计算机信息处理方面,以周昌乐教授为首的课题组正在进行人机对话,手写汉字的机器识别,运用计算机提取、编制语言特征识别软件,及对疑伪佛经、小说的作者和年代等语料进行鉴别考证工作。周昌乐的《手写汉字的机器识别》、《无心的机器》等著作就是作者在信息处理理论方面的积极探索。本中心策划组织的敦煌文献数据库建设计划已正式启动。香港年代公司为本项目的第一期工作提供了50万元的经费资助。估计该数据库总字数将达八千万左右。录入数据库的敦煌文献将按传统的四部分类法整理编排。整理工作包括定名、解题、录文、校勘等项。经精心整理校勘的录文输入电脑后,将编制编号、书名、卷名、字词等多种检索程序,再配以原件的图版,以增加可信度,图(敦煌写卷)(经过标点整理的录文)对照,为学术界提供一套校录精确、查阅方便的敦煌文献的查阅检索系统。整个数据库既将制成光盘出版发行,还将建立敦煌文献多媒体可视化网站,供全世界研究人员和感兴趣的公众查询和使用,从事敦煌学研究的各国学人(包括利用敦煌资料的学者),将能化费不多的钱而拥有一整套敦煌文献,并且图文对照,检索便捷,从而使珍贵的敦煌卷子从图书馆走进学者的书房,使敦煌文献成为世界学人在书房中即可利用的材料。这对于促进敦煌学研究的深入和普及,使敦煌学在新的世纪取得更大的辉煌,将发挥巨大的作用。另外,本中心拟建设中古近代汉语语料库;并已和美国、挪威、日本、台湾、香港等地的有关院校和学者达成了交换共享语料的协议,也和四川大学、湖南师范大学、上海师范大学等有关单位达成了类似的协议,和上海师大的任海波等从事计算语言学研究的学者也有比较多的联系。我们初步考虑是:第一,投入专项经费,尽快建立专门的电脑室,把中古近代汉语语料库建立起来;第二,力争尽快地引进这方面的专门人材,已经有目标;第三,在三年内为计算机信息处理设立一个重大课题。本领域是一个发展前景极为广阔的天地,我们还刚刚起步,今后定将投入比较多的人力和物力,优先予以发展。