第14辑 2020

由中国社会科学出版社出版,一共收录15篇学术论文。

 

GIBBON Dafydd

RHYTHM FORMANTS OF STORY READING IN STANDARD MANDARIN

 

WU Xiyu, KONG Jiangping

LIFESPAN CHANGE OF VOICE IN MANDARIN CHINESE SPEAKERS

 

刘新中 曾玲

汉语方言声调古今对照与共时分布的研究方法——基于字音系统实验研究工具

 

于珏 林裕鑫 金倩雯

人工耳蜗植入儿童普通话卷舌元音的习得研究

 

YANG Jing, XU Li

DURATION AND AMPLITUDE OF TONE PRODUCTION IN CHILDREN WITHCOCHLEAR IMPLANTS

 

涂顺顺 沈新佳 张蓓华 陈伟民 倪佳伶 赵艳嫔 吴志远

唐氏综合征合并听力障碍儿童听觉言语康复的个案研究

 

管晶晶 刘畅

共振峰增强对噪音下汉语普通话语音感知的影响

 

王非凡

口罩对语音产出及感知的影响

 

冯杰 伍新春

汉语人工耳蜗使用者声调感知和产生研究综述

 

倪佳伶 陈伟民 张蓓华 沈新佳 涂顺顺 赵艳嫔 吴志远

听力障碍儿童言语语言治疗的研究现状

 

LIAO Sishi, DING hongwei

PERCEPTION OF VELARIZED /l/ AND VOWEL /ɔ/ CONTRAST BY CHINESE LEARNERS OF ENGLISH

 

徐亮 王宇

汉语官话方言区英语学习者元音的声学特征和语音偏误

 

张凌

普通话和“台湾国语”在语流中的节奏特征——以《还珠格格》为例

 

王大佐

普通话阴平—上声听感边界的再测试

 

王玮 张劲松

博士学位论文《大规模汉语中介语语音库设计和标注研究》简介

 

点此查看更多内容

第13辑 2020

由中国社会科学出版社出版,一共收录14篇学术论文。

 

杨洁 孔江平

汉语陈述句和疑问句感知范畴研究

 

张高媛 王韫佳 黄靖雯

声学线索掩蔽下普通话情感语音的听辨研究

 

王蓓 邱新仪 张夏夏 刘广盈

二语焦点语调产出——跟读和同声模仿比较

 

殷治纲

再论韵律边界的声学特征及其形成机制

 

刘帅 王曼

口语单词产出的音韵编码过程研究

 

蒋红柳

成都方言单字四声调音高特征研究

 

吴西愉 孔江平 方强 魏建国

元音和声调的相互作用——以侗语为例

 

曹梦雪

昌黎城关方言语音探微

 

曹洪林 张晓琳

中国声纹鉴定证据庭审应用现状的实证研究

 

LI Mingxing

IMPLICATIONAL RELATION AND PERCEPTUAL DISTINCTION: A CASE STUDY ON PLACE CONTRASTS OF FRICATIVES VS. AFFRICATES

 

GUO Taiyang,ZHAO Bin,ZHANG Gaoyan,DANG Jianwu,UNOKI Masashi

FREQUENCY-DIFFERENTIATED BRAIN NETWORK DYNAMICS IN REAL WORDS AND PSEUDOWORDS PERCEPTION

 

LUO Yingyi,SONG Binbin

PROSODIC REALIZATION OF FRENCH COMPLEXES WITH CAUSAL CONJUNCTIONS

 

CHEN Shuwen

PRODUCTl0N AND PERCEPTION OF ENGLISH RHOTIC SOUNDS BY MANDARIN-ENGLISH BILINGUALS

 

杨玉芳

语言表达的心理机制——《语言产生:心理语言学的视角》书评

 

点此查看更多内容

软件工具

1. xRecorder:语音语料库录制工具 

作者:熊子瑜
脚本ID:Tools.XZY20211011.001
上传时间:2021年10月11日
简介:语音语料库录制工具 xRecorder 程序由熊子瑜设计开发,属于 xSpeechTools 工具的一个子程序,主要面向语音语料库建设中的录音任务,支持 wav 格式的音频文件录制、播放与声学参数分析显示。主要功能包括:(1)程序支持用户自由定制发音文本内容及其声音文件名(可使用多层级相对路径),基本能够满足有发音底稿的语音库录制需求,特别适用于字、词、句材料的大规模录音任务。(2)程序可按照固定或随机的顺序逐条显示发音文本,并按照用户设定的路径和文件名自动保存录制好的声音文件(*.wav)及其相应的发音文本内容(*.txt)。(3)程序支持用户逐条设置各类发音提示,如提示文本、提示声音(*.wav)或提示图片(*.jpg)等。(4)程序可检测全局最大振幅和首尾段的最大振幅,全局最大振幅如果大于或小于设定的阈值则会自动报错并强制重新录音,首尾段的最大振幅如果大于设定的阈值则会自动报错并强制重新录音,可有效避免振幅过大或过弱,还可避免非正常截断等类型的错误数据。(5)程序可实时显示波形图和宽带语图,有利于用户掌控发音进程,还可以缩放显示波形图和语图,并可以分析选定段的音高数据。(6)程序支持用户对发音文本内容的编辑修改和自动保存。(7)程序支持用户截取保存声音片段,或剪切掉噪声段数据,对声音进行整理。(8)每次重启程序,会自动定位至第一个未录制的条目,以避免出现条目遗漏。

下载 xRecorder 程序

《汉语口语语篇库:建构与标注》

当前是大数据和人工智能迅速发展和广为应用的时代,数字资源已成为科学研究和人工智能技术应用的重要要素,而语音数据库建设是语音研究以及语音识别、语音合成、口语对话系统、语音翻译、语音评测等诸多应用系统的重要基础。其中,语音数据的标注,则是语音数据库建设的核心。面向特定应用的语音数据的深度标注,往往体现了语音学和语言学的研究成果,是其与言语工程的最好结合点。

该书面向新一代语言认知智能技术,在语音学和语言学的研究成果基础上,对实际言语交际产生的口语语篇进行结构和功能的描述和表示,整合语音和自然语言处理领域的标注规范,建立汉语口语语篇的多层级标注规范,通过对海量中文口语语篇的深度标注,为语音研究和应用提供重要的理论和数据支撑。

该书系统介绍了2000年以来,作者及其团队在语音库建设、标注标准方面的工作,包括相关术语、语言学与语音学的理论基础等。在语音库制作规范和面向口语语篇的多层级结构表示体系和标注规范方面,重点介绍了口语语篇的语音基础标注(音段标注规范SAMPA-C和韵律标注规范C-TOBI)、汉语口语语篇的依存关系标注、汉语口语语篇的修辞结构标注、面向口语对话交际意图理解的言语行为和情感语音标注等。其次,分别介绍两个典型语音库:汉语十大方言区地方普通话语音库RASC863和汉语口语语篇库Discourse-CASS。其中,口语语篇库Discourse-CASS有1100多段自然口语对话,具有18层标注信息,内容来自四个领域:真实电话服务应用领域的客服对话(如餐厅订餐服务、出租车预定服务、机场咨询服务等)、面对面朋友之间的聊天、朋友之间的网络语聊以及话剧口语对话。最后,基于Discourse-CASS标注信息,给出了四种实际应用场景下各种语音学、语言学统计分布信息,如声、韵、调以及各级韵律单元的出现频度、长度和时长信息,口语对话中言语行为分类,非规范口语现象,情感分类信息等。

该书适用于语音学、自然口语信息处理、语言教学等方向的研究人员或者数据公司的专业标注人员作为参考。书中基础标注样例和统计信息以电子资源形式在网上与读者共享。


目录

第一章 引言

第一节 语言与言语

第二节 复杂场景中口语语篇的特点

第三节 语音与语言资源建设

第二章 术语与理论基础

第一节 引用规范和基本术语

第二节 语篇分析相关理论简述

第三节 汉语口语语篇研究

第三章 语音库规范

第一节 语音库的元数据

第二节 语音库制作

第三节 法律与伦理问题

第四章 语音库的语音基础标注规范

第一节 音字转写规范

第二节 汉语音段标注规范SAMPA-C

第三节 语音韵律标注

第五章 面向自然口语语篇的依存语法标注

第一节 依存语法简介

第二节 汉语依存语法相关研究

第三节 基于自然口语的依存语法标注

第六章 面向自然口语语篇的修辞结构标注

第一节 修辞结构理论简介

第二节 修辞关系集

第三节 基于自然口语的修辞结构标注

第七章 基于互动意图的对话言语行为和情感标注

第一节 发音人信息标注

第二节 话轮切分和话轮转换的功能标注

第三节 话语标记的功能分类与标注

第四节 功能语段切分

第五节 对话行为标注第六节 情感语音标注

第八章 语音识别语料库RASC863

第一节 背景

第二节 语音库制作过程和一般规范

第三节 方言口音普通话语音库RASC863制作介绍

第四节 连续汉语语音识别语音库RASC863的朗读语料设计

第五节 RASC863语音标注规范第六节 即兴口语语言学单元统计

第九章 具有深度言语信息标注的口语语篇库Discourse-CASS

第一节 口语语篇库Discourse-CASS的基本信息

第二节 基于Discourse-CASS多层级标注信息统计

 

汉语口语语篇库:建构与标注:construction and annotation
  • ISBN:9787520375696
  • 出版社:中国社会科学出版社
  • 作者:李爱军
  • 出版日期:2021-03-01
  • 中图分类:H193.2
  • 页数:348

李爱军,中国社会科学院语言研究所研究员、副所长,博士生导师。研究方向为言语韵律、L1&L2语音习得、语音语料库标准与建设。

阅读原文

关注方言语音问题 推进语音学研究

作为语言学的一门重要分支学科,语音学通过仪器设备来获取语音产出、语音传播和语音感知等方面的实验数据,然后在此基础上分析考察人类语言的发音机制、语音声学特性和语音知觉模式等一系列问题,内容涉及发音语音学、声学语音学和听觉语音学等多个研究领域。语音学具有鲜明的交叉学科性质,与方言学、音系学的关系较为密切,与生理学、声学、心理学等也有着一定关联,其研究成果对于语言调查与研究、语言教学与评测、语言矫治与康复、人机对话与交互等都有着重要的应用价值。

在方言语音研究中成长

语音学在我国发端于方言语音实验研究工作,至今已有近百年的历史,向前可以追溯至20世纪20年代初。赵元任、刘复、罗常培和王力等学者都非常重视方言语音实验研究工作,强调“解决积疑,可资实验以补听官之缺”,并在研究方言语音时带头身体力行。

那一时期方言语音实验研究蔚然成风,发表了一批结合语音实验数据的方言声调研究成果。这些著述为方言语音研究,特别是方言声调研究工作,引入了实验分析的新方法,建立并形成了研究方言声调的新范式。赵元任当年提出的五度标调法,至今仍被方言学界和语音学界广泛使用。

虽然萌芽于方言语音研究,并且在方言声调研究中取得了诸多重要成果,但语音实验研究却未能在方言领域落地生根,而是逐渐从方言研究中独立了出来,慢慢发展成为今天的(实验)语音学。若要追根溯源的话,那一时期的方言语音实验研究为我国(实验)语音学的创建提供了两个重要源头:一是刘复回国后在北京大学建立的“语音乐律实验室”,该实验室后来由罗常培领导;二是吴宗济在南京中研院历史语言研究所语音实验室担任研究助理,跟随赵元任开展的语音学研究。罗常培后来担任中国科学院语言研究所所长,在“语音乐律实验室”的基础上组建了语音实验小组,并于1956年将吴宗济调入语言研究所开展语音实验研究工作,使得这两个源头合到了一起,语音学研究才逐渐步入正轨。

在方言语音研究中壮大

自20世纪90年代末以来,随着计算机技术、数字信号处理以及数据统计分析等技术的发展,特别是在Praat、MatLab、SPSS等软件的推动下,研究人员采集和分析语音声学数据的门槛已基本被破除,不仅能够自行构建较大规模的语音语料库并在此基础上开展语音声学数据的采集工作,还可以利用各种统计软件甚至深度学习的方法开展语音声学数据的分析和建模工作。语音声学研究由此彻底摆脱了硬件依赖,普通科研人员开展语音实验研究已不再是遥不可及的梦想,这种改变必将深刻推动语音学的发展进程。

而在此之前很长一段时间,开展语音实验研究一直存在着较高的准入门槛,采集实验数据需要有专门的仪器设备,分析实验数据需要有专门的测算方法。不管是做发音生理研究,还是做语音声学研究,都离不开实验数据的采集和分析,都需要使用到一定的仪器设备。就拿语音声学研究来说,因为长期依赖于浪纹计和语图仪等仪器设备,导致国内只有为数不多的几家科研机构才能开展相关研究工作,一般科研人员很难接触到这些仪器设备,更别说使用这些仪器设备了。另外,即便有了语图仪这类专业的仪器设备,也不能直接获得语音的音高数据、共振峰数据等声学参数,仍然需要研究人员通过手工去提取、测算和分析,而这些过程不仅费时费力,而且极其复杂,掌握起来存在一定难度。受这些因素的影响,语音学那些年在国内的发展极为缓慢,人才队伍规模相对较小。到20世纪八九十年代,国内从事语音实验研究工作的只有吴宗济、林焘、鲍怀翘、林茂灿、曹剑芬、沈炯、石锋等为数不多的几位学者。在此条件下,大家只能集中力量优先研究普通话的语音问题,对方言语音的研究自然就会少一些。

现在有了Praat这类语音分析软件,语音声学数据的提取、测算和分析都可以在个人电脑上完成,难度自然是降低了不少,但对于任何一款专业软件来说,都会存在一定的使用门槛,要想全面掌握其功能和用法还是需要花费一番功夫的。当下应积极推广语音实验研究的技术和方法,并努力降低语音数据提取、测算和分析的难度,让更多学者愿意并能够轻松自如地使用起来。与语音学界相比,方言研究领域的人才队伍规模宏大,而且多多少少都会涉及语音研究问题,因此应有针对性地加大语音实验技术和方法在方言研究领域的推广力度,让广大方言研究者看到语音实验在方言语音研究中的价值,并成为语音实验研究的拥护者和主力军。

在方言语音研究中突破

虽然脱胎于方言语音实验研究,但语音实验这种研究方法在方言领域至今仍未产生深刻影响。除了前文所述的技术设备等制约因素,可能还有一个重要的原因,即语音实验结果并不能直接回答方言研究者所关心的语音分类和音值描写问题。举例来说,在做声调音高特征分析时,实验者通常还是依靠听音记音这种传统方式来确定各个例字的声调类别或者采用别人的记音结果,然后在此基础上去分析各类声调的音高、时长等声学特征,得到的调值分析结果又往往会和听辨记音结果存在一定出入,而且不同实验由于采样数据和分析方法的不同,调值分析结果之间也可能会出现不一致。这类语音实验研究,并不能给方言研究者太多助力,因为对于方言语音系统研究来说,首先是要解决语音分类问题,如确定一个方言有多少个声母、韵母和声调等,其次才是音值的描写问题。实际上,即便对于音值的分析和描写,语音实验研究能够提供的助益也是极其有限的,如辅音的发音部位很难通过其声学线索来加以确定,元音的前化、后化、高化、低化、央化等发音变化也很难依靠声学数据来加以确定,即便是鼻化元音和卷舌元音也不能纯粹依靠声学数据来加以确定。因此,语言实验研究在面对方言时,应注意以下几个方面问题。

一是创新语音实验研究的方式方法。除了语音声学研究之外,还要善于利用听辨感知实验和发音生理实验来研究两个音的异同与两个音之间的区分线索及其发音差异。在对各类语音声学参数进行统计分析时,除了采取均值分析、方差分析,还可以做一做判别分析、聚类分析以及数据建模等方面的工作,看看语音数据能否支持前期的分类结果,及其能否为语音分类多提供一些声学数据上的支撑。

二是注重跨方言的语音对比研究。在听音记音时,不同学者所采取的标准可能会不太一致,有人可能会稍微严一点,有人可能会稍微宽一点,记音结果有时差异甚大,导致不同方言点、不同学者之间的记音数据很难直接放在一起进行有效的对比分析。而从客观的语音声学数据出发,开展跨方言的语音对比研究,建立语音声学模型,并在此基础上测算方言之间的语音相似度和距离,进而考察方言的语音演变规律,可以推动语音实验研究与方言研究的深度融合。

三是注重后词汇系统的语调韵律特征研究。目前大多数方言研究只关注字词层面的声韵调和连读变调等内容,对语句层面的语调韵律特征鲜有涉及。而语调韵律特征系统具有鲜明的方言特色,应着手构建一套跨方言的大规模语音数据库,并在此基础上考察方言的语调韵律特征,对之进行系统而全面的分析和描写,从而建立起统一而完备的语调韵律分析框架。目前这方面几乎还是一片空白,类型学研究在这方面将大有可为,而且能够凸显出语音实验研究的价值。

四是注重从智能语音技术发展的角度研究方言语音。要让智能语音技术不仅能够听懂普通话,还能听懂地方普通话和各种主要方言,这自然离不开方言语音研究,离不开方言发音词典建设,特别是汉语通用词汇的方言语音描写工作,其中涉及连读变调、轻声、儿化等一系列语音问题。另外,还应积极借助智能语音技术推进方言语音研究,如采用合成验证的方式来检验和改进各项语音研究成果。

五是注重从语音习得和教学的角度去研究方言语音。不同方言区学习者在学习普通话、英语等语言时都有着不同的学习难点和发音偏误问题,这与学习者的母语语音系统之间存在一定的关联性。

总之,语音学研究应自我突破,多关注方言语音问题,并通过合适的角度融入方言语音研究中,真正发挥出语音实验这种研究方法在方言研究中的独特价值,争取在方言研究领域取得共鸣,并在研究方言语音问题的过程中不断发展壮大。

原文刊于《中国社会科学报》2021年4月20日第2150期。