简介 | 汉语口语语篇库 Discourse-CASS

Discourse-CASS是目前规模最大的具有深度标注的口语语篇库。为什么称为深度标注?首先是标注的层级多,多达18层;另外是标注的内容“深”,包括了口语语篇的多层级表示和标注体系的大部分层级信息(见李爱军,《汉语口语语篇库: 建构与标注》,社科出版社):音段和韵律标注、言语行为标注、修辞关系和依存关系标注、应答关系标注、情感态度标注等。

Discourse-CASS分为几个子库,先后得科技部国家重点研发计划-政府间国际科技创新合作重点专项-中欧政府间合作项目(2017YFE0111900)、973项目以及科技部重点研发项目(2013CB329301)、国家高技术研究发展计划863项目(2001AA114012)、国家社科基金重点项目(01AYY002)支持。

标注内容包含18层信息,如图所示,第1层为发音人信息描述层(发音人年龄、口音、与对话人之前的关系等);第2层为句子编号(以话轮为基础进行标记,方便提取句子进行自动语音切分处理);第3层为话轮;第4层为汉字;第5层为句子;第6层为单字;第7层为拼音;第8层为声韵母;第9层为韵律边界;第10层为韵律重音;第11层为副语言现象;第12层为音质;第13层为语用基础标注集;第14层为言外意;第15层为主题;第16层为邻接对;第17层为口语现象;第18层为情感。

tup1具有深度标注的网聊自然口语对话标注示例

第16辑 2021

目录

  1. Li Yinghao ZHang Jinghua AN ULTRASOUND AND EPG INVESTIGATION OF CORONAL FRICATIVES IN YANBIAN KOREAN
  2. 许可 黄玮 冉启斌 梁煜珠 汉语方言中的基频微扰与振幅微扰
  3. 梁昌维 普通话单双音节声母唇形协同发音研究
  4. 黄慧怡 董理 昆剧净和老生行当情感念白发声研究
  5. 董理 谈笑 昆剧小生行当情感念白声学研究
  6. 王璐 马睿启 山东快书语音声学分析
  7. 冯雅心 汪高武 脱口秀演员、非演员和AI对喜剧脚本语音呈现的差异
  8. 李晓媛 刘文 相声贯口声学实验研究
  9. 刘增慧 梁淑芬 白语儿童焦点韵律的习得和发展
  10. 殷治纲 汉语词汇层面的轻重音研究
  11. 郑雅鲯 雷丁一 徐若敖 汪高武 山东方言对英语元音学习的影响及可视化教学设计
  12. 张驰 胡宁萱 张劲松 日本、韩国、哈萨克、越南普通话学习者的轻声产出
  13. 陈雪嫚 曹文 越南留学生汉语四字组韵律偏误研究
  14. 王颖阳 彭文杰 张劲松 视听及听觉训练下的日本学生汉语焦点重音习得声学分析
  15. 陈禹风 鼻音测量计应用指南
  16. 叶俊廷 陈滢 《元音研究》述评

第15辑 2021

由中国社会科学出版社出版,一共收录16篇学术论文。

孔江平 吴西愉
人类语音起源和演化研究综述

陈忠敏
语音感知的特点及其解剖生理机制

熊子瑜
基于汉语方言字音系统实验研究工具的合肥话与北京话声母系统对比分析

LI Qian
AGE-RELATED VARIATION OF PLOSIVE VOICE ONSET TIME IN STANDARD CHINESE

于 珏 金倩雯 林裕鑫
言语香蕉图国内外研究回顾、评述及前瞻

李宏娜 曹梦雪
由感知维度看西胪方言阴去调与阳去调的演变

董文琪 刘 文
山东桓台方言入声调今读变异的声学与感知研究

王延慧 傅 林
基于听辨实验的武安话阴平与阳平合流研究

李叙辰 刘 彬
音段与声调:听觉记忆的发音延长效应探究

余俊毅 曾 玲 刘新中
末点音高对广州话低调域调类感知边界的影响

黄蔚雯 任姝童 顾文涛
汉语自闭症谱系障碍儿童对塞音送气和声调的范畴感知

ZHOU Weijing, ZHAN Lamei, NOLAN Francis, GONG Jian, XUE Xiaojiao, WANG Zhiyan
EFFECTS OF SYLLABLE STRUCTURES ON THE PERCEPTION OF L2 ENGLISH LEXICAL STRESS AMONG TEENAGE MANDARIN LISTENERS

LI Ya
SYLLABLE-BASED ACOUSTIC SIMULATION PROCESS IN SECOND LANGUAGE PRODUCTION

敖 敏
基于 PENTA 模型的蒙古语陈述句语调合成实验

FANG Qiang
INCORPERATING ARTICULATORY VELOCITY INFORMATION IN ACOUSTIC-TO-ARTICULATORY INVERSION

中国社会科学论坛(2022,语言学)——新时代语音学前沿问题国际研讨会

自20世纪20年代以来,语音学在中国已经发展了近一个世纪。在吴宗济、林焘、鲍怀翘、林茂灿等老一辈学者的带领下,国内语音学在语音声学、发音生理等诸多研究方面都取得了可喜成绩。随着智能语音技术的发展和大规模语音语料库建设门槛的降低,知识、数据和技术三者之间水乳交融、彼此促进,语音学研究在人工智能、语音教学、语言健康等领域的应用价值也日益凸显,语音学研究的方向必将随之发生深刻变化。未来语音学界应重点关注哪些研究领域,进而形成新的学术增长点,值得探究和讨论。

作为2022年度“中国社会科学论坛”的一场重要国际学术活动,本次研讨会由中国社会科学院语言研究所、北京语言大学、中国语言学会语音学分会联合主办,由语言研究所语音研究室和北京语言大学语言科学院联合承办,拟于2022年10月中下旬采取线上、线下相结合的方式在北京举行。本次研讨会将围绕“新时代语音学前沿问题”这一主题,邀请国内外知名语音学家做大会报告,分享他们的最新研究成果,并将组织多个学术专题,集中呈现国内外语音研究的最新发展动态。

本次会议主要以线上视频会议方式参加,所有报告人需在9月底之前提交演讲录像,时长不超过30分钟,会议工作语言为汉语和英语,录制的演讲内容应为可公开的学术研究成果。会议期间还将组织一定场次的交流讨论。更多详细信息将通过“今日语言学”微信公众号和中国语言学分会语音学会网站推送,敬请关注。

会议荣誉主席
林茂灿 研究员(中国社会科学院语言研究所)
曹剑芬 研究员(中国社会科学院语言研究所)

会议主席
李爱军 研究员(中国社会科学院语言研究所)
曹 文 研究员(北京语言大学)
熊子瑜 研究员(中国社会科学院语言研究所)

会议组织委员会
曹 文 研究员(北京语言大学)
胡 方 研究员(中国社会科学院语言研究所)
孔江平 教授(北京大学)
李爱军 研究员(中国社会科学院语言研究所)
马秋武 教授(北京语言大学)
熊子瑜 研究员(中国社会科学院语言研究所)
张劲松 研究员(北京语言大学)

会议联系人
李 倩 博士(中国社会科学院语言研究所)
E-Mail:li_qian@cass.org.cn
Tel:86-10-85195394

重要时间节点
论文详细摘要(中文摘要需另附英文翻译)提交截止时间:2022年6月30日
邀请函发出时间:2022年8月31日
发言人学术信息提交截止时间:2022年9月30日
会议时间:2022年10月20-22日

Chinese Forum of Social Sciences (2022, Linguistics)
International Symposium on Frontier Issues of Phonetics in the New Era

Since the 1920s, the field of phonetics has developed in China for nearly a century. Based on works of the pioneers in this field such as WU Zongji, LIN Tao, BAO Huaiqiao, and LIN Maocan, Chinese phoneticians have made great achievements in many aspects such as acoustic phonetics, articulatory phonetics and so on. With the development of speech technology and the lowering of the threshold for the construction of large-scale speech corpora, knowledge, data and technology have been integrated and mutually promoted. Given the increasing importance of phonetic research in fields such as artificial intelligence, language teaching and language healthy, the direction of phonetic research will inevitably undergo profound changes. Future research areas that the phonetic community should endeavor therefore are worth exploring and discussing.

As an important part of the “Chinese Forum of Social Sciences 2022”, this symposium is jointly sponsored by the Institute of Linguistics at Chinese Academy of Social Sciences, Beijing Language and Culture University, and the Phonetics Association of China, and organized by the Phonetics Lab from the Institute of Linguistics and the Academy of Linguistics, Beijing Language and Culture University. The symposium will be held in Beijing in mid-late October 2022 in a hybrid mode. It will focus on the theme of “Frontier Issues in Phonetics in the New Era”. Well-known phoneticians in China and from abroad will be invited to give a keynote talk and share their latest research in various topics. Discussion sessions will also be arranged after the talks.

All speakers must submit a video of their speech by the end of September, and the length of the speech should not exceed 30 minutes. The working languages of the symposium are Chinese and English. The contents of the recorded speech should be results that can be made public.

Further details will be announced through the official account of “Linguistics Today” in WeChat and the official website of Chinese Phonetics Association under Chinese Language Society.

Honorary Chair
Prof. LIN Maocan (Institute of Linguistics, Chinese Academy of Social Sciences)
Prof. CAO Jianfen (Institute of Linguistics, Chinese Academy of Social Sciences)

Conference Chair
Prof. LI Aijun (Institute of Linguistics, Chinese Academy of Social Sciences)
Prof. CAO Wen (Beijing Language and Culture University)
Prof. XIONG Ziyu (Institute of Linguistics, Chinese Academy of Social Sciences)

Organizing Committee
Prof. CAO Wen (Beijing Language and Culture University)
Prof. HU Fang (Institute of Linguistics, Chinese Academy of Social Sciences)
Prof. KONG Jiangping (Peking University)
Prof. LI Aijun (Institute of Linguistics, Chinese Academy of Social Sciences)
Prof. MA Qiuwu (Beijing Language and Culture University)
Prof. XIONG Ziyu (Institute of Linguistics, Chinese Academy of Social Sciences)
Prof. ZHANG Jinsong (Beijing Language and Culture University)

Contact
Dr. LI Qian (Institute of Linguistics, Chinese Academy of Social Sciences)
E-mail: li_qian@cass.org.cn
Tel: 86-10-85195394

Important Dates
Deadline for detailed abstract submission (Chinese abstracts should be submitted with an English translation): 30 June 2022
Invitation letter issued: 31 August 2022
Deadline for speaker information submission: 30 September 2022
Conference: October 20-22, 2022

2021年语音研究报告

第14辑 2020

由中国社会科学出版社出版,一共收录15篇学术论文。

 

GIBBON Dafydd

RHYTHM FORMANTS OF STORY READING IN STANDARD MANDARIN

 

WU Xiyu, KONG Jiangping

LIFESPAN CHANGE OF VOICE IN MANDARIN CHINESE SPEAKERS

 

刘新中 曾玲

汉语方言声调古今对照与共时分布的研究方法——基于字音系统实验研究工具

 

于珏 林裕鑫 金倩雯

人工耳蜗植入儿童普通话卷舌元音的习得研究

 

YANG Jing, XU Li

DURATION AND AMPLITUDE OF TONE PRODUCTION IN CHILDREN WITHCOCHLEAR IMPLANTS

 

涂顺顺 沈新佳 张蓓华 陈伟民 倪佳伶 赵艳嫔 吴志远

唐氏综合征合并听力障碍儿童听觉言语康复的个案研究

 

管晶晶 刘畅

共振峰增强对噪音下汉语普通话语音感知的影响

 

王非凡

口罩对语音产出及感知的影响

 

冯杰 伍新春

汉语人工耳蜗使用者声调感知和产生研究综述

 

倪佳伶 陈伟民 张蓓华 沈新佳 涂顺顺 赵艳嫔 吴志远

听力障碍儿童言语语言治疗的研究现状

 

LIAO Sishi, DING hongwei

PERCEPTION OF VELARIZED /l/ AND VOWEL /ɔ/ CONTRAST BY CHINESE LEARNERS OF ENGLISH

 

徐亮 王宇

汉语官话方言区英语学习者元音的声学特征和语音偏误

 

张凌

普通话和“台湾国语”在语流中的节奏特征——以《还珠格格》为例

 

王大佐

普通话阴平—上声听感边界的再测试

 

王玮 张劲松

博士学位论文《大规模汉语中介语语音库设计和标注研究》简介

 

点此查看更多内容

第13辑 2020

由中国社会科学出版社出版,一共收录14篇学术论文。

 

杨洁 孔江平

汉语陈述句和疑问句感知范畴研究

 

张高媛 王韫佳 黄靖雯

声学线索掩蔽下普通话情感语音的听辨研究

 

王蓓 邱新仪 张夏夏 刘广盈

二语焦点语调产出——跟读和同声模仿比较

 

殷治纲

再论韵律边界的声学特征及其形成机制

 

刘帅 王曼

口语单词产出的音韵编码过程研究

 

蒋红柳

成都方言单字四声调音高特征研究

 

吴西愉 孔江平 方强 魏建国

元音和声调的相互作用——以侗语为例

 

曹梦雪

昌黎城关方言语音探微

 

曹洪林 张晓琳

中国声纹鉴定证据庭审应用现状的实证研究

 

LI Mingxing

IMPLICATIONAL RELATION AND PERCEPTUAL DISTINCTION: A CASE STUDY ON PLACE CONTRASTS OF FRICATIVES VS. AFFRICATES

 

GUO Taiyang,ZHAO Bin,ZHANG Gaoyan,DANG Jianwu,UNOKI Masashi

FREQUENCY-DIFFERENTIATED BRAIN NETWORK DYNAMICS IN REAL WORDS AND PSEUDOWORDS PERCEPTION

 

LUO Yingyi,SONG Binbin

PROSODIC REALIZATION OF FRENCH COMPLEXES WITH CAUSAL CONJUNCTIONS

 

CHEN Shuwen

PRODUCTl0N AND PERCEPTION OF ENGLISH RHOTIC SOUNDS BY MANDARIN-ENGLISH BILINGUALS

 

杨玉芳

语言表达的心理机制——《语言产生:心理语言学的视角》书评

 

点此查看更多内容

软件工具

1. xRecorder:语音语料库录制工具 

作者:熊子瑜
工具ID:Tools.XZY20211116.001
更新时间:2021年11月16日
简介:语音语料库录制工具 xRecorder 程序由熊子瑜设计开发,属于 xSpeechTools 工具的一个子程序,主要面向语音语料库建设中的录音任务,支持 wav 格式的音频文件录制、播放与声学参数分析显示。主要功能包括:(1)程序支持用户自由定制发音文本内容及其声音文件名(可使用多层级相对路径),基本能够满足有发音底稿的语音库录制需求,特别适用于字、词、句材料的大规模录音任务。(2)程序可按照固定或随机的顺序逐条显示发音文本,并按照用户设定的路径和文件名自动保存录制好的声音文件(*.wav)及其相应的发音文本内容(*.txt)。(3)程序支持用户逐条设置各类发音提示,如提示文本、提示声音(*.wav)或提示图片(*.jpg)等。(4)程序可检测全局最大振幅和首尾段的最大振幅,全局最大振幅如果大于或小于设定的阈值则会自动报错并强制重新录音,首尾段的最大振幅如果大于设定的阈值则会自动报错并强制重新录音,可有效避免振幅过大或过弱,还可避免非正常截断等类型的错误数据。(5)程序可实时显示波形图和宽带语图,有利于用户掌控发音进程,还可以缩放显示波形图和语图,并可以分析选定段的音高数据。(6)程序支持用户对发音文本内容的编辑修改和自动保存。(7)程序支持用户截取保存声音片段,或剪切掉噪声段数据,对声音进行整理。(8)每次重启程序,会自动定位至第一个未录制的条目,以避免出现条目遗漏。

查看详情  |  下载 xRecorder 程序


2. xSegmenter:音段自动切分与标注工具

作者:熊子瑜
工具ID:Tools.XZY20211116.002
更新时间:2017年1月10日
简介:xSegmenter采用Perl脚本语言编写,主要面向较大规模的具有文字底稿的语音语料库建设,旨在解决音段标注的效率和一致性问题。该程序通过调用HTK工具,基于用户所提供的语料及相关资源训练生成HMM声学模型,然后进行音段强制对齐,最后针对每个声音文件转写生成相应的语音标注文件(*.TextGrid),包括文本层、词语层、音节层和音素层等标注内容。由于该工具自身不提供任何声学模型和词典,而是基于用户所提供的声音文件,带有分词信息的发音文本文件和发音词典文件等数据资源自动训练生成相应的语音声学模型,然后再利用所生成的语音声学模型去完成音段的自动切分和标注任务,因此这一工具可适用于任意语言和方言的语音库建设。

0001

自动切分与标注结果示例

查看详情  |  下载 xSegmenter 程序


3. xPerception:语音感知实验工具

作者:熊子瑜
工具ID:Tools.XZY20211116.003
更新时间:2021年11月16日
简介:该工具能够记录被试操作的按键名称,还可以记录用户对各个声音文件的操作反应时间,能够基本满足语音感知实验的数据采集要求,既可用于语音感知实验,也可用于语音训练。程序可支持文字和图片两种格式的提示内容,除了可记录用户的按键操作外,也可记录用户在电脑屏幕上的点击操作。程序启动之后,会首先显示引导页内容信息,然后等被试按“空格键”后开始语音感知实验过程。此程序会以随机或者顺序的模式播放指定文件夹(可包含测试声音文件夹和训练声音文件夹)或数据表中给出的全部声音文件,并记录用户的按键名称和反应时,即被试的按键时间与声音播放起始时间点、或声音播放结束时间点、或提示信息显示出来的时间点之间的时间差,单位为毫秒。结果数据会保存在测试用的声音文件夹之中,或者与数据表文件保存在同一个文件夹之中。另外,此程序会自动检测上次听辨过程是否完全结束,并提示用户是否继续执行未完成的听辨过程,因此用户可以随时关闭或重启听辨程序。此程序还允许用户执行多次听辨过程(听完所有声音文件为一次完整听辨过程),其结果文件会分别采用1、2、3、4等序号加以区别,每次退出程序时会自动保存数据。

0002

xPerception 程序运行界面示例(点击操作)

0002

 xPerception 程序运行界面示例(按键操作)

 查看详情  |  下载 xPerception 程序

《汉语口语语篇库:建构与标注》

当前是大数据和人工智能迅速发展和广为应用的时代,数字资源已成为科学研究和人工智能技术应用的重要要素,而语音数据库建设是语音研究以及语音识别、语音合成、口语对话系统、语音翻译、语音评测等诸多应用系统的重要基础。其中,语音数据的标注,则是语音数据库建设的核心。面向特定应用的语音数据的深度标注,往往体现了语音学和语言学的研究成果,是其与言语工程的最好结合点。

该书面向新一代语言认知智能技术,在语音学和语言学的研究成果基础上,对实际言语交际产生的口语语篇进行结构和功能的描述和表示,整合语音和自然语言处理领域的标注规范,建立汉语口语语篇的多层级标注规范,通过对海量中文口语语篇的深度标注,为语音研究和应用提供重要的理论和数据支撑。

该书系统介绍了2000年以来,作者及其团队在语音库建设、标注标准方面的工作,包括相关术语、语言学与语音学的理论基础等。在语音库制作规范和面向口语语篇的多层级结构表示体系和标注规范方面,重点介绍了口语语篇的语音基础标注(音段标注规范SAMPA-C和韵律标注规范C-TOBI)、汉语口语语篇的依存关系标注、汉语口语语篇的修辞结构标注、面向口语对话交际意图理解的言语行为和情感语音标注等。其次,分别介绍两个典型语音库:汉语十大方言区地方普通话语音库RASC863和汉语口语语篇库Discourse-CASS。其中,口语语篇库Discourse-CASS有1100多段自然口语对话,具有18层标注信息,内容来自四个领域:真实电话服务应用领域的客服对话(如餐厅订餐服务、出租车预定服务、机场咨询服务等)、面对面朋友之间的聊天、朋友之间的网络语聊以及话剧口语对话。最后,基于Discourse-CASS标注信息,给出了四种实际应用场景下各种语音学、语言学统计分布信息,如声、韵、调以及各级韵律单元的出现频度、长度和时长信息,口语对话中言语行为分类,非规范口语现象,情感分类信息等。

该书适用于语音学、自然口语信息处理、语言教学等方向的研究人员或者数据公司的专业标注人员作为参考。书中基础标注样例和统计信息以电子资源形式在网上与读者共享。


目录

第一章 引言

第一节 语言与言语

第二节 复杂场景中口语语篇的特点

第三节 语音与语言资源建设

第二章 术语与理论基础

第一节 引用规范和基本术语

第二节 语篇分析相关理论简述

第三节 汉语口语语篇研究

第三章 语音库规范

第一节 语音库的元数据

第二节 语音库制作

第三节 法律与伦理问题

第四章 语音库的语音基础标注规范

第一节 音字转写规范

第二节 汉语音段标注规范SAMPA-C

第三节 语音韵律标注

第五章 面向自然口语语篇的依存语法标注

第一节 依存语法简介

第二节 汉语依存语法相关研究

第三节 基于自然口语的依存语法标注

第六章 面向自然口语语篇的修辞结构标注

第一节 修辞结构理论简介

第二节 修辞关系集

第三节 基于自然口语的修辞结构标注

第七章 基于互动意图的对话言语行为和情感标注

第一节 发音人信息标注

第二节 话轮切分和话轮转换的功能标注

第三节 话语标记的功能分类与标注

第四节 功能语段切分

第五节 对话行为标注第六节 情感语音标注

第八章 语音识别语料库RASC863

第一节 背景

第二节 语音库制作过程和一般规范

第三节 方言口音普通话语音库RASC863制作介绍

第四节 连续汉语语音识别语音库RASC863的朗读语料设计

第五节 RASC863语音标注规范第六节 即兴口语语言学单元统计

第九章 具有深度言语信息标注的口语语篇库Discourse-CASS

第一节 口语语篇库Discourse-CASS的基本信息

第二节 基于Discourse-CASS多层级标注信息统计

 

汉语口语语篇库:建构与标注:construction and annotation
  • ISBN:9787520375696
  • 出版社:中国社会科学出版社
  • 作者:李爱军
  • 出版日期:2021-03-01
  • 中图分类:H193.2
  • 页数:348

李爱军,中国社会科学院语言研究所研究员、副所长,博士生导师。研究方向为言语韵律、L1&L2语音习得、语音语料库标准与建设。

阅读原文

关注方言语音问题 推进语音学研究

作为语言学的一门重要分支学科,语音学通过仪器设备来获取语音产出、语音传播和语音感知等方面的实验数据,然后在此基础上分析考察人类语言的发音机制、语音声学特性和语音知觉模式等一系列问题,内容涉及发音语音学、声学语音学和听觉语音学等多个研究领域。语音学具有鲜明的交叉学科性质,与方言学、音系学的关系较为密切,与生理学、声学、心理学等也有着一定关联,其研究成果对于语言调查与研究、语言教学与评测、语言矫治与康复、人机对话与交互等都有着重要的应用价值。

在方言语音研究中成长

语音学在我国发端于方言语音实验研究工作,至今已有近百年的历史,向前可以追溯至20世纪20年代初。赵元任、刘复、罗常培和王力等学者都非常重视方言语音实验研究工作,强调“解决积疑,可资实验以补听官之缺”,并在研究方言语音时带头身体力行。

那一时期方言语音实验研究蔚然成风,发表了一批结合语音实验数据的方言声调研究成果。这些著述为方言语音研究,特别是方言声调研究工作,引入了实验分析的新方法,建立并形成了研究方言声调的新范式。赵元任当年提出的五度标调法,至今仍被方言学界和语音学界广泛使用。

虽然萌芽于方言语音研究,并且在方言声调研究中取得了诸多重要成果,但语音实验研究却未能在方言领域落地生根,而是逐渐从方言研究中独立了出来,慢慢发展成为今天的(实验)语音学。若要追根溯源的话,那一时期的方言语音实验研究为我国(实验)语音学的创建提供了两个重要源头:一是刘复回国后在北京大学建立的“语音乐律实验室”,该实验室后来由罗常培领导;二是吴宗济在南京中研院历史语言研究所语音实验室担任研究助理,跟随赵元任开展的语音学研究。罗常培后来担任中国科学院语言研究所所长,在“语音乐律实验室”的基础上组建了语音实验小组,并于1956年将吴宗济调入语言研究所开展语音实验研究工作,使得这两个源头合到了一起,语音学研究才逐渐步入正轨。

在方言语音研究中壮大

自20世纪90年代末以来,随着计算机技术、数字信号处理以及数据统计分析等技术的发展,特别是在Praat、MatLab、SPSS等软件的推动下,研究人员采集和分析语音声学数据的门槛已基本被破除,不仅能够自行构建较大规模的语音语料库并在此基础上开展语音声学数据的采集工作,还可以利用各种统计软件甚至深度学习的方法开展语音声学数据的分析和建模工作。语音声学研究由此彻底摆脱了硬件依赖,普通科研人员开展语音实验研究已不再是遥不可及的梦想,这种改变必将深刻推动语音学的发展进程。

而在此之前很长一段时间,开展语音实验研究一直存在着较高的准入门槛,采集实验数据需要有专门的仪器设备,分析实验数据需要有专门的测算方法。不管是做发音生理研究,还是做语音声学研究,都离不开实验数据的采集和分析,都需要使用到一定的仪器设备。就拿语音声学研究来说,因为长期依赖于浪纹计和语图仪等仪器设备,导致国内只有为数不多的几家科研机构才能开展相关研究工作,一般科研人员很难接触到这些仪器设备,更别说使用这些仪器设备了。另外,即便有了语图仪这类专业的仪器设备,也不能直接获得语音的音高数据、共振峰数据等声学参数,仍然需要研究人员通过手工去提取、测算和分析,而这些过程不仅费时费力,而且极其复杂,掌握起来存在一定难度。受这些因素的影响,语音学那些年在国内的发展极为缓慢,人才队伍规模相对较小。到20世纪八九十年代,国内从事语音实验研究工作的只有吴宗济、林焘、鲍怀翘、林茂灿、曹剑芬、沈炯、石锋等为数不多的几位学者。在此条件下,大家只能集中力量优先研究普通话的语音问题,对方言语音的研究自然就会少一些。

现在有了Praat这类语音分析软件,语音声学数据的提取、测算和分析都可以在个人电脑上完成,难度自然是降低了不少,但对于任何一款专业软件来说,都会存在一定的使用门槛,要想全面掌握其功能和用法还是需要花费一番功夫的。当下应积极推广语音实验研究的技术和方法,并努力降低语音数据提取、测算和分析的难度,让更多学者愿意并能够轻松自如地使用起来。与语音学界相比,方言研究领域的人才队伍规模宏大,而且多多少少都会涉及语音研究问题,因此应有针对性地加大语音实验技术和方法在方言研究领域的推广力度,让广大方言研究者看到语音实验在方言语音研究中的价值,并成为语音实验研究的拥护者和主力军。

在方言语音研究中突破

虽然脱胎于方言语音实验研究,但语音实验这种研究方法在方言领域至今仍未产生深刻影响。除了前文所述的技术设备等制约因素,可能还有一个重要的原因,即语音实验结果并不能直接回答方言研究者所关心的语音分类和音值描写问题。举例来说,在做声调音高特征分析时,实验者通常还是依靠听音记音这种传统方式来确定各个例字的声调类别或者采用别人的记音结果,然后在此基础上去分析各类声调的音高、时长等声学特征,得到的调值分析结果又往往会和听辨记音结果存在一定出入,而且不同实验由于采样数据和分析方法的不同,调值分析结果之间也可能会出现不一致。这类语音实验研究,并不能给方言研究者太多助力,因为对于方言语音系统研究来说,首先是要解决语音分类问题,如确定一个方言有多少个声母、韵母和声调等,其次才是音值的描写问题。实际上,即便对于音值的分析和描写,语音实验研究能够提供的助益也是极其有限的,如辅音的发音部位很难通过其声学线索来加以确定,元音的前化、后化、高化、低化、央化等发音变化也很难依靠声学数据来加以确定,即便是鼻化元音和卷舌元音也不能纯粹依靠声学数据来加以确定。因此,语言实验研究在面对方言时,应注意以下几个方面问题。

一是创新语音实验研究的方式方法。除了语音声学研究之外,还要善于利用听辨感知实验和发音生理实验来研究两个音的异同与两个音之间的区分线索及其发音差异。在对各类语音声学参数进行统计分析时,除了采取均值分析、方差分析,还可以做一做判别分析、聚类分析以及数据建模等方面的工作,看看语音数据能否支持前期的分类结果,及其能否为语音分类多提供一些声学数据上的支撑。

二是注重跨方言的语音对比研究。在听音记音时,不同学者所采取的标准可能会不太一致,有人可能会稍微严一点,有人可能会稍微宽一点,记音结果有时差异甚大,导致不同方言点、不同学者之间的记音数据很难直接放在一起进行有效的对比分析。而从客观的语音声学数据出发,开展跨方言的语音对比研究,建立语音声学模型,并在此基础上测算方言之间的语音相似度和距离,进而考察方言的语音演变规律,可以推动语音实验研究与方言研究的深度融合。

三是注重后词汇系统的语调韵律特征研究。目前大多数方言研究只关注字词层面的声韵调和连读变调等内容,对语句层面的语调韵律特征鲜有涉及。而语调韵律特征系统具有鲜明的方言特色,应着手构建一套跨方言的大规模语音数据库,并在此基础上考察方言的语调韵律特征,对之进行系统而全面的分析和描写,从而建立起统一而完备的语调韵律分析框架。目前这方面几乎还是一片空白,类型学研究在这方面将大有可为,而且能够凸显出语音实验研究的价值。

四是注重从智能语音技术发展的角度研究方言语音。要让智能语音技术不仅能够听懂普通话,还能听懂地方普通话和各种主要方言,这自然离不开方言语音研究,离不开方言发音词典建设,特别是汉语通用词汇的方言语音描写工作,其中涉及连读变调、轻声、儿化等一系列语音问题。另外,还应积极借助智能语音技术推进方言语音研究,如采用合成验证的方式来检验和改进各项语音研究成果。

五是注重从语音习得和教学的角度去研究方言语音。不同方言区学习者在学习普通话、英语等语言时都有着不同的学习难点和发音偏误问题,这与学习者的母语语音系统之间存在一定的关联性。

总之,语音学研究应自我突破,多关注方言语音问题,并通过合适的角度融入方言语音研究中,真正发挥出语音实验这种研究方法在方言研究中的独特价值,争取在方言研究领域取得共鸣,并在研究方言语音问题的过程中不断发展壮大。

原文刊于《中国社会科学报》2021年4月20日第2150期。