当前是大数据和人工智能迅速发展和广为应用的时代,数字资源已成为科学研究和人工智能技术应用的重要要素,而语音数据库建设是语音研究以及语音识别、语音合成、口语对话系统、语音翻译、语音评测等诸多应用系统的重要基础。其中,语音数据的标注,则是语音数据库建设的核心。面向特定应用的语音数据的深度标注,往往体现了语音学和语言学的研究成果,是其与言语工程的最好结合点。
该书面向新一代语言认知智能技术,在语音学和语言学的研究成果基础上,对实际言语交际产生的口语语篇进行结构和功能的描述和表示,整合语音和自然语言处理领域的标注规范,建立汉语口语语篇的多层级标注规范,通过对海量中文口语语篇的深度标注,为语音研究和应用提供重要的理论和数据支撑。
该书系统介绍了2000年以来,作者及其团队在语音库建设、标注标准方面的工作,包括相关术语、语言学与语音学的理论基础等。在语音库制作规范和面向口语语篇的多层级结构表示体系和标注规范方面,重点介绍了口语语篇的语音基础标注(音段标注规范SAMPA-C和韵律标注规范C-TOBI)、汉语口语语篇的依存关系标注、汉语口语语篇的修辞结构标注、面向口语对话交际意图理解的言语行为和情感语音标注等。其次,分别介绍两个典型语音库:汉语十大方言区地方普通话语音库RASC863和汉语口语语篇库Discourse-CASS。其中,口语语篇库Discourse-CASS有1100多段自然口语对话,具有18层标注信息,内容来自四个领域:真实电话服务应用领域的客服对话(如餐厅订餐服务、出租车预定服务、机场咨询服务等)、面对面朋友之间的聊天、朋友之间的网络语聊以及话剧口语对话。最后,基于Discourse-CASS标注信息,给出了四种实际应用场景下各种语音学、语言学统计分布信息,如声、韵、调以及各级韵律单元的出现频度、长度和时长信息,口语对话中言语行为分类,非规范口语现象,情感分类信息等。
该书适用于语音学、自然口语信息处理、语言教学等方向的研究人员或者数据公司的专业标注人员作为参考。书中基础标注样例和统计信息以电子资源形式在网上与读者共享。
目录
第一章 引言
第一节 语言与言语
第二节 复杂场景中口语语篇的特点
第三节 语音与语言资源建设
第二章 术语与理论基础
第一节 引用规范和基本术语
第二节 语篇分析相关理论简述
第三节 汉语口语语篇研究
第三章 语音库规范
第一节 语音库的元数据
第二节 语音库制作
第三节 法律与伦理问题
第四章 语音库的语音基础标注规范
第一节 音字转写规范
第二节 汉语音段标注规范SAMPA-C
第三节 语音韵律标注
第五章 面向自然口语语篇的依存语法标注
第一节 依存语法简介
第二节 汉语依存语法相关研究
第三节 基于自然口语的依存语法标注
第六章 面向自然口语语篇的修辞结构标注
第一节 修辞结构理论简介
第二节 修辞关系集
第三节 基于自然口语的修辞结构标注
第七章 基于互动意图的对话言语行为和情感标注
第一节 发音人信息标注
第二节 话轮切分和话轮转换的功能标注
第三节 话语标记的功能分类与标注
第四节 功能语段切分
第五节 对话行为标注第六节 情感语音标注
第八章 语音识别语料库RASC863
第一节 背景
第二节 语音库制作过程和一般规范
第三节 方言口音普通话语音库RASC863制作介绍
第四节 连续汉语语音识别语音库RASC863的朗读语料设计
第五节 RASC863语音标注规范第六节 即兴口语语言学单元统计
第九章 具有深度言语信息标注的口语语篇库Discourse-CASS
第一节 口语语篇库Discourse-CASS的基本信息
第二节 基于Discourse-CASS多层级标注信息统计
- ISBN:9787520375696
- 出版社:中国社会科学出版社
- 作者:李爱军
- 出版日期:2021-03-01
- 中图分类:H193.2
- 页数:348
李爱军,中国社会科学院语言研究所研究员、副所长,博士生导师。研究方向为言语韵律、L1&L2语音习得、语音语料库标准与建设。
(阅读原文)