MAGICDATA Mandarin Chinese Read Speech Corpus
755 小时中文普通话朗读语音数据集,1080 位中国大陆说话人录制,是万小时级语料库的子集
数据时长
755 hours
语种
1 种
采样率
16 kHz
发布时间
2019-05
数据集描述
1755 小时朗读语音,以手机录制数据为主
21,080 位来自中国不同口音区域的说话人
3在安静室内环境中录制
4录音文本领域多样:交互问答、音乐搜索、社交消息、智能家居控制等
5该数据集是更大规模语料库(10,566.9 小时)的子集
6免费供学术使用
语种明细
| 语言名称 | 时长 |
|---|---|
| 普通话 | 755 hours |
发布单位