KeSpeech
1542 小时普通话及其 8 种方言子方言的开源语音数据集,覆盖 34 座城市 27,237 位说话人
数据时长
1542 hours
语种
9 种
采样率
16 kHz
发布时间
2021-12
数据集描述
1来自中国 34 座城市的 27,237 位说话人录制
2发音包含标准普通话及 8 种子方言
3提供多维标注:内容转写、说话人身份、子方言标签
4支持语音识别、说话人识别、子方言识别和语音转换等多任务
5免费供学术使用
语种明细
| 语言名称 | 时长 |
|---|---|
| 普通话 | None |
| 东北方言 | None |
| 中原官话 | None |
| 西南官话 | None |
| 江淮官话 | None |
| 吴语 | None |
| 粤语 | None |
| 闽南语 | None |
| 客家话 | None |
发布单位