中国社会科学院语言研究所语音与言语科学重点实验室作为首批进入我院哲学社会科学创新工程的试点单位,于2011年10月份正式签约成立。按照“理论联系实际、科研服务社会”的发展理念,重点实验室根据语音与言语科学的交叉学科性质,提出“理论研究与应用研发并举”的科研创新思路,把语音与言语科学中的重大基础理论和应用技术需求作为主要研究对象,一手抓重大基础理论研究,一手抓应用成果研发。
自成立以来,在院、所领导以及各职能部门的关心支持下,在专业学术委员会的悉心指导下,重点实验室全体科研人员秉承“敢为人先、迎难而上”的开拓创新精神,围绕着“夯实基础、巩固优势、扩大影响”的阶段性发展目标,努力工作,积极探索,扎实推进各项研究,力争能够“带好头、开好步”,为我院分期分批逐步推进哲学社会科学创新工程全力做好首批试点的各项工作。
一、目标定位
语音与言语科学重点实验室作为中国社会科学院首批进入创新工程的试点单位,主要依托语言研究所语音实验室,通过科研管理体制和机制的创新,多方面整合国内语音与言语科学相关领域的研究资源和人才力量,立足于语音与言语科学领域的重大基础理论研究,同时坚持“理论研究与应用研发并举”的发展思路,通过构建语音与言语资源建设和信息技术开发创新平台,开展面向实际应用的语音与言语科学研究工作,推动智能语音与言语科技的发展进程,肩负起引领我国语音与言语科学研究发展方向之重任,服务于国家语言文化发展战略。
二、发展规划
语音与言语科学重点实验室按照“理论研究与应用研发并举”的发展思路,实行“以研究带动开发、以开发促进研究”的发展模式,多方面整合国内语音与言语科学领域的研究资源和人才力量,开展语音与言语科学领域的重大基础理论研究和智能语音技术的研发工作。围绕创建国际一流的汉语语音与言语科学重点实验室的奋斗目标,我们将在未来5年集中力量开展以下几个方面的研究工作:
(一)重大基础理论研究工作
- 人类发音机理研究
- 语音与语言类型学研究
- 汉语儿童音系和语法的获得与认知发展研究
- 语音韵律和音系的声学、认知和多模态研究
(二)应用系统研发工作
- 面向国际汉语教学应用的三维动态发音生理模型
- 语言脑认知神经计算模型
- 语音与语言资源网络服务平台
三、研究项目
根据重点实验室的发展定位,并结合科研人员的专业特长,在实验室的建设中,共设计了5个主要科研课题。
- 面向国际汉语教学应用的三维动态发音生理模型(李爱军、胡方、方强)
- 汉语方言和中国境内少数民族语言的语音与语言调查研究(胡方)
- 语言习得与认知研究(胡建华、高军、贾媛、殷治纲、王伟)
- 语音和语言资源网络服务平台建设(熊子瑜、华武)
- 网络环境下的口语语篇结构与语音特征(李爱军、贾媛)
四、阶段性成果
(一)论文著作
近一年来,重点实验室共出版3部学术专著,其中英文著作2部,中文著作1部。项目组成员发表学术论文88篇,其中:英文论文42篇,中文论文46篇;英文期刊论文3篇,中文期刊论文17篇;国际会议论文38篇,国内会议论文30篇。获EI检索论文14篇,还有多篇论文进入国内核心期刊,有1篇论文获第十届全国语音学会议优秀学生论文奖,1篇论文获Interspeech 2012优秀学生论文提名奖,1篇论文获ISCSLP 2012优秀学生论文奖,1篇论文获O-COCOSDA 2012优秀学生论文奖。
(二)数据资源建设
近一年来,重点实验室在数据库建设方面主要开展了以下几个工作:
- 儿童语言习得多模态数据库CASS-CHILD,收集1-4岁儿童与家人自然对话语料,为研究儿童语言的学习与获得提供数据支撑。
- 情感语料库CASS-EMC,由专业演员表演7种不同情绪的语音数据,以研究情感与语音之间关系,包括语音、视频和三维EMA发音的中日两种语言的数据。
- AESOP—中国各大方言区英语学习者语音库,在中国10个方言区的24个城市收集带有方言口音的英语录音数据,以研究英语学习与方言之间的关系。
- IPA发音数据库CASS-IPA,录制国际音标实际读音,并采集发音过程中的舌位运动以及唇形变化等生理数据,为构建三维动态发音模型服务。
- 大规模动态文本语料库,每天自动跟踪主流平面媒体,采集报刊文本语料,并进行自动建档、文本提取、分词和词频统计等分析工作。
(三)应用平台研发
近一年来,重点实验室自主开发完成了一套应用软件:基于网络的语音录制和分析软件,该软件具有在线录音、编辑、播放和分析等诸多功能,已被用于语音地理信息平台。并与科大讯飞等单位合作,委托并指导合作单位,开发了9套基于互联网技术的应用平台。其中,未登录词发现与标注平台、词语信息服务平台、文件资源管理平台、婴幼儿词汇问卷调查平台等已经投入使用。对于这些网络应用平台,重点实验室拥有完全知识产权。