Multilingual LibriSpeech (MLS)
大规模多语种有声书语音数据集,覆盖 8 种语言约 50,000 小时,包含 44,500 小时英语
数据时长
50500 hours
语种
8 种
采样率
16 kHz
发布时间
2020-12
数据集描述
1源自 LibriVox 有声书项目
2覆盖 8 种语言:英语、德语、荷兰语、西班牙语、法语、意大利语、葡萄牙语、波兰语
3英语约 44,500 小时,其他语言总计约 6,000 小时
4为所有语言提供语言模型和基线 ASR 模型
语种明细
| 语言名称 | 时长 |
|---|---|
| 英语 | 44500 hours |
| 德语 | None |
| 荷兰语 | None |
| 西班牙语 | None |
| 法语 | None |
| 意大利语 | None |
| 葡萄牙语 | None |
| 波兰语 | None |
发布单位