ReazonSpeech
超过 35,000 小时的大规模日语语音识别数据集,从日本地面电视流媒体中收集
数据时长
35000 hours
语种
1 种
采样率
16 kHz
发布时间
2023-01
数据集描述
1从日本地面电视广播中收集的自然日语语音
2v2.0 版本超过 35,000 小时,v1.0 版本为 19,000 小时
3提供 5 种不同规模的子集
4为遵守版权法,数据在语句级别进行了随机打乱,防止重建原始电视节目
5仅限日本著作权法第 30-4 条规定的用途
语种明细
| 语言名称 | 时长 |
|---|---|
| 日语 | 35000 hours |
发布单位