Libri-Light
60,000 小时英语无标注语音基准数据集,用于无监督和半监督语音识别研究
数据时长
60000 hours
语种
1 种
采样率
16 kHz
发布时间
2019-12
数据集描述
1从 LibriVox 有声书提取的 60,000 小时无标注英语语音
2超过 7,000 位独立说话人
3提供三种规模的无标注子集:60Kh、6Kh、600h
4附带少量标注训练集:10h、1h、10min,用于半监督学习
5提供 VAD、SNR、体裁和说话人 ID 等元数据
6所有数据集、指标和基线系统均开源
语种明细
| 语言名称 | 时长 |
|---|---|
| 英语 | 60000 hours |
发布单位