The People's Speech
30,000 小时大规模多样化英语语音识别数据集,采用 CC-BY-SA 许可,支持学术和商业使用
数据时长
30000 hours
语种
1 种
采样率
16 kHz
发布时间
2021-11
数据集描述
1从 Internet Archive 收集已有音频并与文本进行强制对齐
2来源多样化:电影、讲座、历史录音、播客等
3包含真实环境噪声和多种口音
4CC-BY-SA 许可(含 CC-BY 子集),支持商业使用
5数据收集成本从预估 500 万美元降至约 3,000 美元
语种明细
| 语言名称 | 时长 |
|---|---|
| 英语 | 30000 hours |
发布单位