GigaSpeech
10000 小时多领域英语语音识别数据集,覆盖有声书、播客和 YouTube 等多种来源
数据时长
10000 hours
语种
1 种
采样率
16 kHz
发布时间
2021-06
数据集描述
110,000 小时高质量标注音频用于监督训练,40,000 小时总音频用于半监督和无监督训练
2来源于有声书、播客和 YouTube,覆盖朗读和自发两种说话风格
3提出新的强制对齐和分段流水线以创建句子片段并过滤低质量转写
4提供 5 种不同规模的训练子集:10h、250h、1000h、2500h 和 10000h
语种明细
| 语言名称 | 时长 |
|---|---|
| 英语 | 10000 hours |
发布单位