社科基金重大项目“中国方言区英语学习者语音习得机制的跨学科研究”开题暨专家咨询会成功举行 20160128

2016年1月28日上午10点,社科重大项目“中国方言区英语学习者语音习得机制的跨学科研究”开题暨专家咨询会在中国社会科学院1141会议室隆重举行。

会议由科研处长张骅同志主持,咨询专家北京外国语大学唐锦兰教授、北京语言大学张劲松教授、清华大学杨小璐教授、中国社会科学院刘丹青研究员、中国社会科学院胡建华研究员,以及课题组成员宋大为教授、冉启斌副教授、顾曰国研究员、胡方研究员等参与了本次会议。

社科重大项目首席专家李爱军研究员向咨询专家报告了项目总体概况,包括研究状况和选题价值、总体框架和预期目标、研究思路和研究方法、重点难点和创新之处等,课题负责人贾媛副研究员报告了各个子课题具体研究内容以及研究计划与安排。报告指出,“哑巴英语”和“中式英语”等问题一直困扰着多数中国英语学习者,为了从根本上解决该问题,构建大规模方言区英语学习者语音库,对不同方言区英语学习者提出系统标注体系,并为大规模方言区英语发音偏误类型研究和矫正系统开发提供重要的数据平台具有重要的意义。该项目拟采用语音分析手段、机器学习方法、心理学研究方法等,以跨学科研究结果为基础,提出针对不同方言区英语学习者的辅音、元音、重音以及语调等发音问题改正策略,将上述跨学科研究的结果作为学习与矫正规则,输入已有的英语口语学习评测系统进行验证,提高面向方言区的英语口语自动评测性能。通过收集三维动态发音运动数据(EMA),用可视化的方法,构建三维发音训练模型,服务于方言区英语能力的评测与英语教学。

与会评审专家认为该项目研究方法新颖,对于方言区英语学习者的口音提高具有重要理论和实际意义,对于该项目一致给予高度评价,并表示将密切关注项目后续发展。此外,各位专家还就项目整体思路与方向以及各个子课题的开展进行了充分讨论,提出了宝贵的意见。

创新工程首期项目(2011-2015)结项报告会

2015年12月15日,院哲学社会科学创新工程首批试点单位“语音与言语科学重点实验室”在语言研究所会议室隆重举行2011——2015年首期创新工程项目成果结项报告会。

会议由首席研究员胡建华同志主持,北京语言大学李宇明教授、天津大学党建武教授、北京大学孔江平教授、深圳大学谭立海教授、中国社会科学院刘丹青研究员、中国社会科学院顾曰国研究员作为评审专家参加了会议。其他出席会议的还有中国社会科学院语言研究所刘晖春书记、中国社会科学院科研局张国春副局长、中国社会科学院财计局戴宏伟处长等院、所领导,以及重点实验室成员胡方博士、熊子瑜博士、殷治纲博士、方强博士、高军博士、夏俐萍博士和研究生等。

重点实验室主任、创新工程项目业务主管李爱军研究员向与会专家、领导汇报了实验室主2011——2015年研究成果。报告内容包括实验室建设、学科建设、人才培养、项目课题、学术成果、学术影响、社会责任等内容。她指出,在过去的五年中,实验室在语音习得与教学、发音生理建模、方言语音特征系统和音系理论等领域建成了多个核心研究团队,联合国内几十家高校和研究院所开展了十余项国际、国家级科研项目及十余个创新工程课题,出版学术专著5部,发表学术论文二百多篇,建成语音数据库十余个,开发多个网络应用平台和语音软件,接收和培养了国内外其他学术单位的访问学者、学生一百多人次。通过哲学社会科学创新工程平台,语音与言语科学重点实验室正向建成国内领先、国际知名的语音学和语言学实验室稳步迈进。

针对实验室的工作成果,与会专家、学者一致给予了高度评价。他们认为实验室过去5年的工作是丰硕而卓有成效的,表现出了很强的科学和技术前瞻性;实验室的工作具有很强的学科交叉特色,顺应了科学发展的潮流;实验室工作注重理论、应用相结合,具有较好的社会影响力;开放实验室模式充分整合社会科研力量,具有科研方式的创新意义。此外,各位专家还就学术发展方向、科研管理模式、人才培养及社会责任等内容进行了充分讨论。

经过半天紧张而充实的汇报、评审与研讨,结项报告会圆满落下了帷幕。这次会议总结了以往工作的成果、经验和教训,为语音与言语科学重点实验室过去五年的工作划下了句号。同时,会议也进一步明确了未来的工作方向,为实验室在今后理论创新和应用创新上做出更大建树提供了理论指导和精神动力。

select3148select3165

乌特勒支语言学系主任Frank Wijnen教授报告

题 目:Language, Learning, and Dyslexia(语言、学习和失语症)

报告人:Frank Wijnen

Utrecht Institute of Linguistics OTS, Utrecht University

主要内容:

Dyslexia is defined as a disorder in learning to read and spell in the absence of other cognitive deficiencies. Evidence is mounting, however, that dyslexia is often associated with a subtle delay in primary language acquisition. It has been hypothesized that reading and writing difficulties are related to a (meta-) phonological processing deficit, but the developmental delay in dyslexic children goes beyond phonology, reaching into syntax, semantics, and pragmatics. Work from the UIL OTS baby lab shows that children in the preschool age with a familial risk of dyslexia show language development delays, and may even present a profile close to that of specific language impairment. We are currently exploring the hypothesis that language delays in children with (a familial risk of) dyslexia are related to a deficit in (implicit) statistical and distributional learning. I will present results from ongoing experiments with babies and toddlers on phonological discrimination, grammatical category induction and nonadjacent dependency learning that support this hypothesis. Furthermore, I will explore the suggestion that statistical learning in language acquisition is a specific implementation of a domain general mechanism. I will focus on relations between language acquisition and other learning processes that rest on the extraction of statistical patterns from sequences of events, notably in the domain of perceptual-motor skills.

http://www.uu.nl/medewerkers/FNKWijnen (Frank Wijnen 教授个人网页链接)

DSC_1218
DSC_1235

台湾中研院语言学研究所郑秋豫教授讲座通知 2015-10-19

题 目:乱中有序──从口语韵律亮点探索实时口语产制规划及信息配置
演讲人:郑秋豫教授
时 间:2015年10月19日(周一)下午2:30
地 点:语言所大会议室

研究假设主要为以下三点:1. 语流信号中,除包含音系对立及句法单位指派的讯息外,同时受上层大范围韵律规划之制约;2. 上层韵律规划所表之投射,以超音段讯息之二分对立区辨为优选,具系统性、可预估(predict)并可解释韵律语境之构组;3.语流中韵律亮点组型变化可与信息结构分布配置对应。 亦即研究假设韵律亮点与信息结构的分布配置能解构、有组型并可预估,也可以提供口语语音信号里的上层韵律成分的系统性构组。

我们把从听感可区辨的韵律亮点(prosodic highlight)分为四级,分析它们在语段中的配置组型在主题转移、话轮交替的信息权重配置的投射意义及声学对比强度级别。

研究切入点是先排除声学信号中表口语语段关连的韵律成分,再厘清实时口语产制时表大范围规划之投射制约是一种指派(specification)。

研究方法采语料库语音学进行量化分析,并以计算语言建立预估模型为测试,并强调语音分析需加强对信号变异的理解,而不应径自抽离语流片段后直接测量。

使用语料包括母语国语(普通话)、母语英语及二语英语,语体则朗读、授课与即兴口语对话进行交叉比对。 声学分析则从超音段对立强度所表之区分。

截至目前的发现显示:韵律亮点以小句为单位系统性的提供投射(projection),表达上层语段产制规划的布局及信息重点配置的范围。 表面上看来,四级的韵律亮点数量有限,其实可解释为通过语段的连贯特征与投射的范围则,有限的韵律亮点及组型,已足以表达信息的重点所在,因此也可视为语言简约(linguistic parsimony)的另一种证据。

关键词:口语语流韵律、韵律亮点、口语产制规划投射、信息结构、音系对立、韵律可预估性、跨语言、跨语体、重点信息焦点

刘丹青所长与语音研究室座谈 2015-10-13

2015年10月13日上午,中国社会科学院语言研究所所长刘丹青同志来到语音研究室,与语音研究室全体科研人员举行了座谈活动。座谈中,刘丹青同志介绍了“库藏语言学”相关理论,听取了语音研究室有关研究进展汇报,并一起就如何从“库藏语言学”视角开展语音学研究进行了讨论。

ASCCD-汉语普通话朗读语篇语料库

资源名称(中、英文)
ASCCD-汉语普通话朗读语篇语料库
ASCCD- Annotated Speech Corpus of Chinese Discourse

资源简介
ASCCD朗读语篇语料库由语篇语料、语音数据和语音学标注信息组成,适用于语言语音研究、语音工程开发和基础汉语普通话教学等领域。

该语音语料库的语料结合学术和工程需求,经过科学的研究、论证、设计而成,内容包括18篇文章,体裁覆盖记叙、议论、通讯、散文等常见文体。语音数据由精选的10位(5女5男)北京地区标准普通话发音人录制而成。声音文件采用高质量16KHZ采样、16位数据、双声道WAV格式存储,库容量约1.5GB。语音学标注信息采用人工标注方法完成,内容包括拼音、声韵母、韵律、重音等。

CADCC-汉语普通话自然口语对话语料库

资源名称(中、英文)
CADCC-汉语普通话自然口语对话语料库
CADCC-Chinese Annotated Dialogue and Conversation Corpus

资源简介

CADCC自然口语对话语料库由自然口语对话语音数据和对话文本组成,适用于自然口语研究、语音识别工程和高级汉语普通话教学等领域。

该语料库为保证自然口语的纯粹性,对发音人对话内容不作任何限制,完全反映真实环境下汉语自然口语特征。语料库语音数据由经过挑选的标准普通话发音人在专业录音环境下录制,共计12个对话单元,每一对话单元有两位发音人。语料库声音数据文件采用高质量16KHZ采样、16位数据、单声道WAV格式存储,库容量约1.6GB。语料库内容文本采用人工标注方式完成,可信度高。

CADCC (Chinese Annotated Dialogue and Conversation Corpus) is a speech corpus designed for linguistic/phonetic research, phonetic engineering and advanced mandarin Chinese teaching. It is composed of speech sound files and the corresponding text files.

In order to make sure the naturalness of the spontaneous speech and to give real reflection of the phonetic features, there’s no limitation about the recording content. All the speakers speak standard mandarin. This corpus was recorded in spontaneous conversation form. 12 conversations (about 1.2GB) were included in the corpus and all text information has been transcribed manually.

The recording format is 16k, 16bit, mono wav.

*  本数据库已经在中文语言资源联盟(http://www.chineseldc.org/)发布,希望购买使用的用户可以与中文语言资源联盟联系。

TSC973-973电话语料库

资源名称(中、英文)
TSC973-973电话语料库
TSC973-Telephone Speech Corpus 973

资源简介
TSC973电话语料库是国家973计划支持项目,由中国科学院自动化研究所(承担语音数据采集工作)和中国社会科学院语言研究所(承担文本转写和语音学标注工作)合作完成。

TSC973由真实环境下收集的酒店订房电话(对话)语音数据、文字转写和多层语音学标注组成。共有10个对话单元(分为93个声音文件),规模约120MB。语音信息采用电话录音通道采集,以8000赫兹,16位,单声道WAV格式存储,文字内容和语音学标注完全由人工手工完成,准确度高。标注信息丰富,共有7层,包括音节、声韵母、副语言学、发音人信息、句式、韵律单元、重音等内容(部分噪音较大的声音未作标注,实际标注文件共83个)。

TSC973主要针对口语(音段、韵律等)研究、语音(识别)工程等领域,尤其适合电话通讯领域的语音学研究。

*  本数据库已经在中文语言资源联盟(http://www.chineseldc.org/)发布,希望购买使用的用户可以与中文语言资源联盟联系。

RASC863——四大方言普通话语音语料库

资源名称(中、英文)
RASC863——四大方言普通话语音语料库
RASC863 — 863 annotated 4 regional accent speech corpus

资源简介
RASC863是在国家863高技术项目支持下完成的四大地方(上海、广州、重庆和厦门)普通话语音语料库。

1996年863语音识别数据库以朗读语体为主,考虑了语音的音段平衡。随着语音识别技术的发展,制作口音和口语化的语音库变得重要起来。所以,我们这次由国家863项目基金支持的RASC863项目,在收集上海、广州、重庆和厦门口音的普通话语音语料库时,突出了口语化的特点,加大了语料覆盖范围。

Funded by the National 863 High-Tech Project, we collected a speech corpus RASC863 with four representative regional accents, namely Chongqing, Shanghai, Guangzhou and Xiamen.

单位名称(中、英文)
中国社会科学院语言所北京建国门内大街5号
中国社会科学院语言所语音研究室
邮政编码:100732
电话:(+86)-010-65237408 / 85195394

Phonetics Lab, Institute of Linguistics, ChineseAcademy of Social Sciences
5 Jian Guo Men Nei Da Jie, Beijing 100732
CHINA
Phone: +86-10-6523 7408
Fax: +86-10-85195396
E-mail: liaj@cass.org.cn

开发时间
2003年1月至2004年6月

规模
每个方言点的发音人为200人(100男+100女),共800人。各方言点发音人情况按照事先设计的年龄、性别和教育背景分布。(详情见“发音人规范”)

RASC863包括自然口语(口语独白和常见问题回答)和朗读(语音平衡句子、常用口语句和常用方言词汇)两大部分。自然口语部分分为依据话题的口语独白和回答问题两个部分:口语独白部分是由发音人从我们事先准备的160个话题中任意选择一个,然后讲述3-5分钟相关内容;回答问题部分是由每个发音人回答15个常见问题。朗读语料部分包括经过挑选的语音平衡句子共2200余句、460个常用口语句以及若干各地方言中常用方言词汇。(详情见“语料设计规范”)

RASC863录音数据收集近距(距嘴角距离2-8CM)和中距(20-50CM)两路数据,每路数据采用16000hz采样、16位、单声道WAV格式存储。(详情请见“录音和存储规范”)

我们对RASC863所有录音数据均作了语音学标注,并在每个方言点挑选出20人数据作了精细标注。(详情请见“语料库标注规范”)

The corpus consists of spontaneous speech, read speech and selected dialectical words. For the spontaneous speech, each speaker was asked to select a topic himself or from our prepared topic sheet with a variety of 160 topics and then to give a 4-5 minute spontaneous speech on the topic. Besides, each speaker was asked to answer 15 questions spontaneously. The read speech consists of 2200 phonetically balanced sentences selected automatically, and 460 sentences frequently used in daily life. For each dialectal region, we prepared those words that are frequently used in daily life and are different from Standard Chinese, and each speaker was asked to read 15 dialectal words. 800 speakers (200 from each region; balanced in terms of the age, sex, and educational background) were recruited in the project.

Up to now, the Chinese Character transcription, as well as the paralinguistic and non-linguistic labeling, has been made for both the spontaneous and read speech. In addition to these, phonetic annotation has been made for the read speech for up to 80 speakers.

定价
见中文语言资源联盟网站http://www.chineseldc.org

相关技术文档
《地方口音普通话语音库RASC863技术报告中文版》
《地方口音普通话语音库RASC863技术报告英文版》
《地方口音普通话语音库RASC863录音存储规范》
《地方口音普通话语音库RASC863发音人规范》
《地方口音普通话语音库RASC863语料设计规范》
《地方口音普通话语音库RASC863标注规范》

*  本数据库已经在中文语言资源联盟(http://www.chineseldc.org/)发布,希望购买使用的用户可以与中文语言资源联盟联系。

RASC863-G2 ——863地方普通话语音语料库(第2批,6地语音库)

资源名称(中、英文)
RASC863-G2 ——863地方普通话语音语料库(第2批,6地语音库)
RASC863-G2 — 863 annotated accent speech corpus(group2, 6 regional corpus)

资源简介
RASC863是在国家863高技术项目支持下完成的地方普通话语音语料库。其中第一批四个地方的数据(上海、广州、重庆和厦门)已经于2004年完成并发布,本语料库(RASC863-G2)是该项目的第二批数据库,共有6个地方的数据(长沙、洛阳、南京、南昌、太原、温州)。

1996年863语音识别数据库以朗读语体为主,考虑了语音的音段平衡。随着语音识别技术的发展,制作口音和口语化的语音库变得重要起来。所以,我们这次由国家863项目基金支持的RASC863项目,在收集地方普通话语音语料库时,突出了口语化的特点,加大了语料覆盖范围。

Funded by the National 863 High-Tech Project, we collected the speech corpus RASC863-G2 with six representative regional accents, namely Changsha, Luoyang, Nanjing, Nanchang, Taiyuan and Wenzhou.

单位名称(中、英文)
中国社会科学院语言所北京建国门内大街5号
中国社会科学院语言所语音研究室
邮政编码:100732
电话:(+86)-010-65237408 / 85195394

Phonetics Lab, Institute of Linguistics, Chinese Academy of Social Sciences
5 Jian Guo Men Nei Da Jie, Beijing 100732
CHINA
Phone: +86-10-6523 7408
Fax: +86-10-85195396
E-mail: yinzhg@cass.org.cn

开发时间
2004年1月至2006年9月

规模
每个方言点的发音人为200人(100男+100女),共1200人。各方言点发音人情况按照事先设计的年龄、性别和教育背景分布。(详情见“发音人规范”)

RASC863-G2包括自然口语部分(口语独白和常见问题回答)和朗读(语音平衡句子、常用口语句和信息通讯语句)部分。自然口语部分分为依据话题的口语独白和回答问题两个部分:口语独白部分是由发音人从我们事先准备的160个话题中任意选择一个,然后讲述3-5分钟相关内容;回答问题部分是由每个发音人回答23个常见问题。朗读语料部分包括经过挑选的语音平衡句子共1890余句、460个常用口语句以及100个面向信息通讯应用的数字、字母、短信内容的混合语料。(详情见“语料设计规范”)

RASC863-G2录音数据收集近距(距嘴角距离2-8CM)和中距(20-50CM)两路数据,每路数据采用16000hz采样、16位、双声道WAV格式存储。(详情请见“录音和存储规范”)

The corpus consists of spontaneous speech, read speech and selected dialectical words. For the spontaneous speech, each speaker was asked to select a topic himself or from our prepared topic sheet with a variety of 160 topics and then to give a 4-5 minute spontaneous speech on the topic. Besides, each speaker was asked to answer 23 questions spontaneously. The read speech consists of 1895 phonetically balanced sentences selected automatically, 460 sentences frequently used in daily life and some, and 100 info-compound sentences (digits, characters, sms) . 1200 speakers (200 from each region; balanced in terms of the age, sex, and educational background) were recruited in the project.

定价
见中文语言资源联盟网站http://www.chineseldc.org

相关技术文档
《地方口音普通话语音库RASC863-G2技术报告中文版》
《地方口音普通话语音库RASC863-G2技术报告英文版》
《地方口音普通话语音库RASC863-G2录音存储规范》
《地方口音普通话语音库RASC863-G2发音人规范》
《地方口音普通话语音库RASC863-G2语料设计规范》
《地方口音普通话语音库RASC863-G2标注规范》

*  本数据库已经在中文语言资源联盟(http://www.chineseldc.org/)发布,希望购买使用的用户可以与中文语言资源联盟联系。

WCSC汉语普通话两音节语音语料库

资源名称(中、英文)
WCSC——汉语普通话两音节语音语料库
WCSC——Word Corpus of Standard Chinese

资源简介
汉语普通话两音节语音语料库由汉语两音节语音数据、两音节语料表及管理软件组成,适用于语言语音研究、语音工程开发和基础汉语普通话教学等领域。

该语音语料库的语料内容结合学术和工程需求,经过科学的研究、论证、设计而成,覆盖汉语普通话常用词和各种声韵、声调和音联组合。两音节语音数据由精选的北京地区男性发音人标准普通话录音资料(txt格式)及其波形(wav格式)和宽带、窄带共振峰语谱图(jpg格式)组成。发音人发音三千多组,声音文件采用高质量16KHZ采样16位数据单声道WAV格式存储,语谱图文件采用JPG图形文件存储,库容量约100MB。

语音语料库管理软件PreSpeech主要包含语音和语谱数据库的增删、语音播放、语谱显示、资料查询、查询条件订制、数据转存和数据编辑等功能,可以使用户实现对数据库资料的充分管理和利用。

* 本数据库已经在中文语言资源联盟(http://www.chineseldc.org/)发布,希望购买使用的用户可以与中文语言资源联盟联系。

SCSC汉语普通话单音节语音语料库

资源名称(中、英文)
SCSC——汉语普通话单音节语音语料库
SCSC——Syllable Corpus of Standard Chinese

资源简介
汉语普通话单音节语音语料库由汉语单音节语音数据、单音节表及管理软件组成,适用于语言语音研究、语音工程开发和基础汉语普通话教学等领域。

该语音语料库的语料内容结合学术和工程需求,经过科学的研究、论证、设计而成,覆盖汉语普通话最常用音节和各种声韵、声调组合。语音数据部分由精选的15位北京地区男性发音人标准普通话录音资料整理组成,每人发音约1275个音节[1],声音文件采用高质量16KHZ采样16位数据单声道WAV格式存储,库容量约250MB。

语音语料库管理软件PreSpeech主要包含语音和语谱数据库的增删、语音播放、语谱显示、资料查询、查询条件订制、数据转存和数据编辑等功能,可以使用户实现对数据库资料的充分管理和利用。

[1] M10号发音人0013-0027声音缺失

本数据库已经在中文语言资源联盟(http://www.chineseldc.org/)发布,希望购买使用的用户可以与中文语言资源联盟联系。

殷治纲「YIN Zhigang」

 yin zhigang1

殷治纲

中国社会科学院语言研究所副研究员;
中国社会科学院研究生院语言学系博士;
美国芝加哥大学语言学系博士后;
中国社会科学院青年人文社会科学研究中心理事;

 

研究领域

语音韵律节奏、语料库语言学、语言多模态、话语交际理论、法律语言学、语音工程等。

科研项目

现主持国家社会科学基金一般项目“中外法庭辩论的语音特征、策略及对判决的影响力研究”。曾主持或参与中国哲学社会科学创新工程课题、美国国家科学基金(NSF)、国家863计划、国家973计划、国家社会科学基金、国家自然科学基金、国家十五课题、社科院重点学科、欧盟TC-STAR项目等国家和国际科研项目,并参加与诺基亚、摩托罗拉、科大讯飞等国际知名语音公司联合研究课题。

工作成果

工作期间,先后在各类期刊、会议、报纸发表论文30余篇;参加制订国家技术质量监督局《汉语语音库与标注通用规范》; 参加编写《中国语言学年鉴》(语音篇)(2004-2008);编写《中国方言有声数据库》软件;多次获语言所所青年学术演讲一、二等奖,曾多次获语言所优秀工作者称号及“优秀青年”称号。

其他学术兼职

目前担任美国The Science and Information Organization国际期刊IJARAI审稿人、上海外国语大学国际文化交流学院技术专家、中国社会科学院语言研究所青年组负责人、中国中文信息学会语言资源联盟联系人等职务。

联系方式

中国北京市建国门内大街5号中国社会科学院语言研究所语音研究室
邮编:100732
电话:+86-10-85195375
E-MAIL: yinzhg@cass.org.cn

 


Zhigang Yin

Associate Professor, Phonetics Laboratory, Institute of Linguistics, IL
Ph.D. in Phonetics,
Councilor, Youth Council of Chinese Academy of Social Sciences (CASS)
Director, Youth Committee of Institute of Linguistics (IL)
Technical Adviser, College of International Education, Shanghai International Studies University
Reviewer, International Journal of Advanced Research in Artificial Intelligence

Phonetics Laboratory, Institute of Linguistics, Chinese Academy of Social Sciences
Address:5# Jianguomennei Dajie, Dongcheng District, Beijing, China 100732
Phone: +86-10-85195375
E-mail: yinzhg@cass.org.cn

EDUCATION

Graduate School of Chinese Academy of Social Sciences, Beijing

Ÿ   Ph.D. in Phonetics,                        2011

       Thesis: Rhythm of Read Speech in Mandarin
       Supervisor: Professor Aijun Li

Ÿ   M.A. in Phonetics, cum laude,        2007

Thesis: Study on ng/a Type of Discourse Markers in Spontaneous Dialogues of Standard Chinese
Supervisor: Professor Aijun Li

Beijing Institute of Petrol-Chemical Technology, Beijing

Ÿ   B.E. in Computer Science,             1999


ACADEMIC AND RESEARCH EXPERIENCE

Chinese Academy of Social Sciences (CASS), Beijing, China

Ÿ   Associate Professor, Phonetics and Speech Science Laboratory, Institute of Linguistics, 2015-Present

Ÿ   Assistant Professor, Phonetics Laboratory, Institute of Linguistics, 2004-2015

Ÿ   Research Assistant, Phonetics Laboratory, Institute of Linguistics, 1999-2004

University of Chicago, Chicago, Illinois, U.S.

Ÿ   Postdoctoral Fellow, Department of Linguistics, 2013-2014

Shanghai International Studies University (SISU), Shanghai, China

Ÿ   Technical Adviser, College of International Education,2012-Present


RESEARCH INTERESTS

Phonetics and Phonology

Ÿ   Prosody, Rhythm, Accent/Stress
Ÿ   Segments

Speech Corpora and Annotation

Ÿ   Read and Spontaneous Speech Corpora
Ÿ   Multi-model Corpora: Multimedia, Gesture, EGG, EEG/ERP, Eye-tracking, Respiratory Signal

Cross-linguistic Research

Ÿ   Neurology and psychology of speech perception
Ÿ   Emotional Speech
Ÿ   Speech Action
Ÿ   Sociophonetics
Ÿ   Speech and Music

PROFESSIONAL TRAINING AND SKILLS
Ÿ   Computer Programming: VB, C/C++, Praat Script
Ÿ   Eye-tracking (Eyelink) and Event-related Potential(ERP) Technique (EGI)
Ÿ   Corpora Design, Professional Recording, Speech Processing, Linguistics Annotating
Ÿ   Anechoic Room Design

PROFESSIONAL MEMBERSHIPS
Ÿ   International Speech Communication Association (ISCA)
Ÿ   International Association of Chinese Linguistics (IACL)
Ÿ   Chinese Information Processing Society of China (CIPSC)
Ÿ   Phonetics Association of China (PAC)

HONORS AND AWARDS
Ÿ   Outstanding Youth Award, Institute of Linguistics, CASS, 2011
Ÿ   The Second Award of Youth Academic Lecture (4 times), Institute of Linguistics, CASS, 2003/2010/2011/2012
Ÿ   Outstanding Graduate Student Award, Graduate School of CASS,2006
Ÿ   Excellent Grade in Annual Performance Appraisal (5 times), Institute of Linguistics, CASS, 2000/2001/2002/2003/2009
Ÿ   The First Award of Youth Academic Lecture, Institute of Linguistics, CASS, 2000

LEADERSHIPS

Chinese Academy of Social Sciences, Beijing

Ÿ   Councilor of Youth Council of CASS, 2011-Present
Ÿ   Director of Youth Committee of Institute of Linguistics,2011-Present

Beijing Institute of Petrol-Chemical Technology, Beijing

Ÿ   President of Student Union, 1997-1999
Ÿ   Commissary of Beijing Students Federation, 1998-1999

SOURCE OF RESEARCH FUNDING
Ÿ   National Social Science Foundation of China, 2015-Present(Project Leader)
   Innovation Foundation of CASS, 2011—2013 (Project Leader)
   National High Technology Research and Development Program of China (863 Program), 2001-2003, 2004-2006, 2006-2009
Ÿ   Motorola (China) Foundation, 2006-2009
Ÿ   Nokia Foundation, 2006-2009
Ÿ   TC-STAR Program of EU, 2006-2007
Ÿ   National Natural Science Foundation of China, 2004-2006
Ÿ   SPEECON Program of EU, 2003-2004
Ÿ   National Basic Research Program of China (973 Program), 2001-2003
Ÿ   National Science Foundation of US, 2000-2002

REVIEWER
Ÿ   International Journal of Advanced Research in Artificial Intelligence(US)
Ÿ   Science and Information Conference 2013 (Landon, UK)

PUBLICATIONS AND PRESENTATIONS
  1. Yin, Z.G., 2012,The Research of the Relationship between Perceived Stress Level and Times of Vibration of Vocal FoldsInternational Journal of Advanced Research in Artificial IntelligenceVol1 issue8, 1-5
  2. Yin, Z.G., May 2012, TVVF-A Characteristic Parameter of Stress, (Oral Presentation) Conference paper presented at the 10th Phonetics Conference of China, Shanghai, China
  3. Yin, Z.G. October 2011, Acoustic and Physiological Analysis of Sonority Sequencing Principle, (Oral Presentation) Conference paper presented at National Conference on Man-Machine Speech Communication, Xi’an, China
  4. Yin, Z.G., May 2010, A Sociophonetic Research based on Cross-Regional Speech Resources, (Oral Presentation) The 18th Annual Conference of International Association of Chinese Linguistics, Harvard University, US
  5. Yin, Z.G., Li, A.J., 2009, The Normalization Research of Speech Corpora, The Anthology of Information Management and Research, 393-409
  6. Yin, Z.G., April 2008, Preliminary Study on Discourse Markers, (Oral Presentation) Conference paper presented at the 8th Phonetics Conference of China, Beijing, China
  7. Yin, Z.G., October 2008, Study on ng/a Type of Discourse Markers in Standard Chinese. ( Poster Presentation) Conference paper presented at Interspeech2008, Brisbane, Australia
  8. Wang, X., Li, A.J., Xiong, Z.Y., Yin, Z.G., 2008, Multi-accent and Multi-lingual Speech Corpus, Conference paper presented at Oriental-Cocosda 2008, Nara, Japan
  9. Yin, Z.G., Li, A.J., Wang, X., 2007, The Phonetic Study on ng, ah Type of Discourse Markers, Technical Acoustics, Vol.26,No.4, 248-251
  10. Yin, Z.G., 2007, The Research of Discourse Markers, Chinese Computing Technologies and Related Linguistics Issues, Publishing House of Electronics Industry, 725-729
  11. Yin, Z.G., Zu, Y.Q., Li, A.J., July 2007, The Construction of Multilingual Speech Corpus for TTS(Oral Presentation) Conference paper presented at International Conference on Multilingual Information Processing, Jilin, China
  12. Yin, Z.G., 2006, The Construction and Application of Speech Corpora, Chinese Social Sciences Today, No. 8, B01
  13. Yin, Z.G., Li, A.J, October 2006, Standardization of Speech Corpus. (Oral Presentation) Conference paper presented at the 20thCODATA International Conference, Beijing, China
  14. Li, A.J, Yin, Z.G., Wang, T.Q., FANG, Q., 2004, RASC863-A Chinese Speech Corpus with Four Regional Accents, Conference paper presented at Oriental-Cocosda2004, New Delhi, India
  15. Li, A.J., Wang, X., Yin, Z.G., October 2003, A Comparative Study of Standard Chinese and Regional Chinese, Conference paper presented at the 6th Phonetics Conference of China, Tianjin, China
  16. Li, A.J., Wang, T.Q., Yin, Z.G., October2003, RASC863-An Annotated 4 Regional Accent Speech Corpus for Mandarin Speech Recognition, Conference paper presented at the 6th Phonetics Conference of China, Tianjin, China
  17. Li, A.J, Chen, X.Y, Sun, G.H, Hua, w., Yin, Z.G., 2002, CASS: A Chinese Spontaneous Speech Corpus with Annotation, Contemporary Linguistics, Vol.4 No.2: 81-89
  18. Yin, Z.G., 2001, A Study of Duration Normalization Based on Speech Corpora, Modern Phonetics of the new century, Tsinghua University Press, 327-331
  19. Li, A.J., Yin, Z.G., Wang, M.L., Xu, B., Zong, C.Q., 2001, CADCC Speech Corpus and the Phonetic Research, Modern Phonetics in the new century, Tsinghua University Press, 317-321
  20. Li, A.J, Lin, M.C., Chen, X.Y, Sun, G.H, Hua, w., Yin, Z.G., 2000,Speech Corpus of Chinese Discourse and the Phonetic Research, Conference paper presented at ICSLP2000, Beijing, China
  21. Li, A.J, Chen, X.Y, Sun, G.H, Hua, w., Yin, Z.G., Zu, Y.Q, Zheng, F., Song, Z.J., 2000, The Phonetic Labeling on Read and Spontaneous Discourse Corpora, Conference paper presented at ICSLP2000, Beijing, China

WORKS SUBMITTED (Core Member of the Project Team)

  1. National Specification of Chinese Speech Corpus and Annotation, General Administration of Quality Supervision, Inspection and Quarantine of the People’s Republic of China, 2007
  2. China Linguistics Yearbook (2004-2008), The Commercial Press, 2008
  3. Motorola Multilingual Speech Corpus for Speech Synthesis, 10 languages, Motorola Research Center (China), 2008
  4. TC-STAR Corpus (Technology and Corpora for Speech to Speech Translation), European Commission, 2007
  5. RASC863-G2 Speech Corpus (863 Annotated 6 Regional Accent Speech Corpus-Group2), 1200 Speakers from 6 dialect Cities, Funded by China National 863 Program, Chinese Linguistic Data Consortium (ChineseLDC, www.ChineseLDC.org), 2006
  6. NOKIA Multilingual Speech Corpus for Speech Recognition, 23 languages, NOKIA Research Center (China), 2005
  7. RASC863-G1 Speech Corpus (863 Annotated 4 Regional Accent Speech Corpus-Group1), 800 Speakers from 4 dialect Cities, Funded by China 863 Program, ChineseLDC, 2004
  8. TSC973 Corpus (973Telephone Speech Corpus), Funded by China National 973 Program, ChinseLDC, 2003
  9. iFlyTek Speech Corpus for Speech Synthesis, iFlyTek Co., LTD. ( The Champion for 7 times in Blizzard Challenge, from 2006-2012), 2003
  10. CADCC Corpus (Chinese Annotated Dialogue and Conversation Corpus), ChinseLDC, 2003
  11. ASCCD Corpus (Annotated Speech Corpus of Chinese Discourse), ChineseLDC, 2002
  12. SPEECON Speech Corpus (Speech-Driven Interfaces for Consumer Devices), 600 Speakers, 5 Recording Environment, Funded by European Commission, Completed in cooperation with Nokia, 2002
  13. CASS Corpus (Chinese Annotated Spontaneous Speech Corpus), Funded by US National Science Foundation, Completed in cooperation with Tsinghua University, 2001