AISHELL-5
首个开源车载多通道多说话人中文语音数据集,100+ 小时真实车内对话,支持说话人分离和语音识别
数据时长
100 hours
语种
1 种
采样率
16 kHz
发布时间
2025-05
数据集描述
1在混合动力汽车内录制,远场麦克风置于车辆前方,每位说话人佩戴高保真近场麦克风
2165 位说话人参与,无明显口音
32-4 位说话人随机就座于车内四个位置,进行无内容限制的自由对话
4总计超过 100 小时:训练集 94 小时,验证集 3.3 小时,两个测试集
5远场音频包含 4 通道,训练集额外包含近场音频
6同时提供大规模噪声数据集用于语音模拟技术研究
7CC BY-SA 4.0 许可
语种明细
| 语言名称 | 时长 |
|---|---|
| 普通话 | 100 hours |
发布单位