FLEURS
Google 发布的 102 种语言 n-way 平行语音基准数据集,每种语言约 12 小时,用于评估通用语音表征
数据时长
1200 hours
语种
102 种
采样率
16 kHz
发布时间
2022-05
数据集描述
1基于机器翻译基准 FLoRes-101 构建的语音版本
2102 种语言的 n-way 平行语音数据,覆盖 16 个语系
3每种语言约 12 小时语音监督数据
4支持语音识别、语种识别、翻译和检索等多种任务
5旨在推动低资源语言的语音技术发展
语种明细
| 语言名称 | 时长 |
|---|---|
| 多语种(102 种语言) | 1200 hours |
发布单位