AISHELL-2
1000 小时工业级普通话语音识别数据集,覆盖 1991 位说话人及多种口音
数据时长
1000 hours
语种
1 种
采样率
16 kHz
发布时间
2018-08
数据集描述
11,991 位来自中国不同口音区域的说话人参与录制
2通过三种并行声学通道录制:高保真麦克风、Android 手机和 iOS 设备
3口音分布:北方口音 1,293 人,南方口音 678 人,其他口音 20 人
4内容覆盖 8 大主题:语音命令、IoT 设备控制、兴趣地点、娱乐、金融、科技、体育、自由对话等
5免费开放给学术研究社区
语种明细
| 语言名称 | 时长 |
|---|---|
| 普通话 | 1000 hours |
发布单位