面向国际汉语教学应用的三维动态发音生理模型

项目负责人:李爱军

参加人:胡方、方强

项目简介

如何运用计算机技术,结合传统的语音与语言研究成果,为语言学习者提供便捷、有效的辅助学习工具,以减少对语言教师的依赖,从上世纪90 年代末期以来一直是国际语音和言语工程学界的一个热点研究。本项研究将利用电磁发音仪、NDI Waves 系统等生理实验设备,采录标准发音人的发音生理数据,并与中国科学技术大学合作开发三维动态发音生理模型,再结合重点实验室多年来在汉语发音生理研究方面积累的数据和资源,搭建普通话发音辅助学习平台,为汉语学习者提供多模态的动态发音指导。

ema
三维动态发音系统

子课题一:面向语音教学应用的三维动态发音生理模型之“汉语发音词典”

如本项研究以对外汉语教学中懂英语的外国成年学习者为明确对象,根据中华人民共和国教育部、国家语言文字工作委员会新近颁布的《汉语国际教育用音节汉字词汇等级划分》规范(2011-02-01实施),建立面向实际应用的“汉语发音词典”发音模型。在此基础上,结合我们多年的汉语发音生理研究基础,我们拟搭建发音辅助学习平台,为孔子学院的学生或者其他汉语作为第二语言学习的学生提供多模态的动态发音指导。

如我们将利用电磁发音仪、NDI Waves系统等生理实验设备,采录播音员级发音人的发音生理数据,并与中国科学技术大学和科大讯飞等单位合作开发三维动态发音生理模型。这是一项可长期持续发展的应用研究,是今后进一步搭建以词典知识产权为核心的对外汉语语音、语言学习平台(网络版、移动终端版)的核心基础。本项目计划于2015年底完成。

子课题二:发音生理模型研究

我们五年的目标是建立一个基于生理特征的发音模型,并结合传统的语音评测和统计求逆的方法,为受试人/学习者提供一个具有视觉反馈的语音学习教学系统。该模型的建立不但填补国内在计算机语音教学领域的空白,而且还能大大降低语音教学对教师的依赖,让学习者随时随地都能学习,提高学习效率,减轻老师的工作强度,同时也有可能创造一定的经济效益和社会效益。此外,生理发音模型的建立,可以帮助我们进一步理解发音器官的位置和形状与声学特征之间的对应关系,厘清声学信号中哪些部分与个人特征相关,哪些特征与语言学符号相关,有助于推动语音识别和说话人识别研究的进一步深入。生理发音模型的语音生成机制完全模仿人的发音生机制,在合成语音时,完全模仿语音生成的生理和物理机制,而不涉及对语音信号的直接操作。与传统的语音合成方法相比,这种方法不会因为发音器官位置和形状的变化给语音的质量带来损伤,能够提供更高的自由度,在多表现力的语音合成方面有着先天的优势。