《语音库建设与分析教程》 | 语音与言语科学重点实验室

著者： 熊子瑜

出版：西安交通大学出版社，2017年出版

简介：

随着计算机技术和数字信号分析技术的发展，语音语料库的建设门槛越来越低，而应用前景却越来越广阔，在语音学、方言学、语言教学、言语工程和语保工程等众多领域受到越来越多的关注，其科研价值、社会价值和经济价值也得到了越来越多的认可。

　　在建库和分析过程中，涉及语料设计、语音采集、语音标注、参数提取和数据分析等各个环节。本书主要介绍笔者这几年在语音语料库建设和数据分析方面所做的一些工作和积累的一些初步经验，其中包括一套录音工具和八个Praat脚本程序的功能和用法，旨在解决语音语料库建设和数据分析中的一些技术问题和效率问题，并试图为语音语料库建设及其基础研究提供一个简便的框架流程。

　　全书共分以下八个章节：

　　第一章主要围绕语音材料的录制和整理问题，介绍笔者所编写的语音语料库录制工具xRecorder的功能和用法。xRecorder录音程序操作简便，并具有语图显示、振幅检测和自动保存录音文件等功能，可在一定程度上提高录音质量和录音速度。

　　第二章主要围绕语音标注的数据录入问题，介绍脚本程序“导入数据并自动生成TextGrid数据对象”的功能和用法。该脚本程序可导入格式化的发音文本数据，并自动生成相应的语音标注文件，能够在一定程度上减少手工录入数据的时间，提高标注数据的一致率。

　　第三章主要围绕语音声学参数文件的生成问题，介绍脚本程序“自动生成各类声学参数文件”　的功能和用法。该脚本程序可支持音高数据、音强数据和共振峰数据等声学参数文件的自动生成，并且能够针对一个文件夹里的全部声音文件，一次性生成所需的声学参数文件。

　　第四章主要围绕标注数据和音高数据的编辑修改问题，介绍脚本程序“顺序检校TextGrid和PitchTier数据对象”的功能和用法。该脚本程序可辅助标注人员控制标注流程，自动读取和保存相应的数据文件，并具有自动配置编辑窗口的各项参数，以及控制编辑窗口的位置和大小等功能，可在一定程度上提高语音标注工作的效率。

　　第五章主要围绕标注数据和各类声学参数的提取问题，介绍脚本程序“标注数据和声学参数提取”的功能和用法。该脚本程序以音节为基础单元，提取相应的标注数据和声学参数，可支持音高数据、音强数据和共振峰数据等声学参数的提取，可针对一个文件夹里的全部数据文件，一次性提取出全部数据结果，并以数据表的形式存放在一个文本文件之中，便于用户开展语音数据分析工作。

　　第六章主要围绕语音数据的分析问题，以普通话字音数据为例介绍时长数据、音高数据和共振峰数据的基本分析方法，以及声调音高曲线图、共振峰轨迹图和声学元音图的制作方法，其中涉及脚本程序“制作声学元音图”的功能和用法。该脚本程序可基于用户提供的单元音共振峰数据表制作出声学元音图，并以不同的颜色和椭圆标示出各个单元音的声学分布空间，便于研究者观察和分析单元音系统的声学格局。

　　第七章主要围绕语音图谱的制作问题，介绍脚本程序“字词材料的语音图谱制作”的功能和用法。该脚本程序可将波形图、宽带语图、共振峰轨迹图、音高数据图，以及声韵调等标注数据制作在一张语音图谱之上，以充分展现字词材料的语音声学特性。　另外，该脚本可基于用户提供的数据表批量制图，特别适合于制作方言字音图谱。

　　第八章主要围绕语音刺激信号的合成问题，介绍脚本程序“元音生成器”和“音高和时长等声学参数移植”的功能和用法。这两个脚本程序可控制和调节语音声学参数制作生成语音刺激信号，用于语音听辨感知实验。其中，元音生成器脚本不仅可用于单元音生成，还可用来生成复合元音。音高和时长等声学参数移植脚本不仅可以针对字词类型的材料进行操作，还可针对语句材料进行操作，如替换全句的音高数据。

　　本书的程序和脚本可有效解决语音语料库建设和数据分析过程中一些常见的痛点问题，比较适合文科背景的科研人员或学生使用。普通读者或用户在使用本书相关的脚本和工具进行操作时，无需具备编程基础，也无需修改任何脚本程序内容，只需要准备好相应的数据文件并配置好相应的输入参数即可运行。建议用户在运行每个脚本或工具之前能够仔细阅读本书相关章节的内容，并尽可能了解其流程和功能，以减少误操作，从而提高工作效率。

　　本书所用到的录音工具和Praat脚本程序已被全部打包在笔者编写的xSpeechTools 语音工具包里，并会不定期更新，感兴趣的读者可以在百度网盘中去下载（电脑上操作）：链接：https://pan.baidu.com/s/1lmiRJlAaHt5L1bYxE5sggg，提取码：8v5c。