《汉语口语语篇库：建构与标注》

当前是大数据和人工智能迅速发展和广为应用的时代，数字资源已成为科学研究和人工智能技术应用的重要要素，而语音数据库建设是语音研究以及语音识别、语音合成、口语对话系统、语音翻译、语音评测等诸多应用系统的重要基础。其中，语音数据的标注，则是语音数据库建设的核心。面向特定应用的语音数据的深度标注，往往体现了语音学和语言学的研究成果，是其与言语工程的最好结合点。

该书面向新一代语言认知智能技术，在语音学和语言学的研究成果基础上，对实际言语交际产生的口语语篇进行结构和功能的描述和表示，整合语音和自然语言处理领域的标注规范，建立汉语口语语篇的多层级标注规范，通过对海量中文口语语篇的深度标注，为语音研究和应用提供重要的理论和数据支撑。

该书系统介绍了2000年以来，作者及其团队在语音库建设、标注标准方面的工作，包括相关术语、语言学与语音学的理论基础等。在语音库制作规范和面向口语语篇的多层级结构表示体系和标注规范方面，重点介绍了口语语篇的语音基础标注（音段标注规范SAMPA-C和韵律标注规范C-TOBI）、汉语口语语篇的依存关系标注、汉语口语语篇的修辞结构标注、面向口语对话交际意图理解的言语行为和情感语音标注等。其次，分别介绍两个典型语音库：汉语十大方言区地方普通话语音库RASC863和汉语口语语篇库Discourse-CASS。其中，口语语篇库Discourse-CASS有1100多段自然口语对话，具有18层标注信息，内容来自四个领域：真实电话服务应用领域的客服对话（如餐厅订餐服务、出租车预定服务、机场咨询服务等）、面对面朋友之间的聊天、朋友之间的网络语聊以及话剧口语对话。最后，基于Discourse-CASS标注信息，给出了四种实际应用场景下各种语音学、语言学统计分布信息，如声、韵、调以及各级韵律单元的出现频度、长度和时长信息，口语对话中言语行为分类，非规范口语现象，情感分类信息等。

该书适用于语音学、自然口语信息处理、语言教学等方向的研究人员或者数据公司的专业标注人员作为参考。书中基础标注样例和统计信息以电子资源形式在网上与读者共享。

语音与言语科学重点实验室

Laboratory of Phonetics and Speech Science, Institute of Linguistics, CASS

目录