HiFiTTS-2
NVIDIA 发布的大规模高带宽英语 TTS 数据集,36700 小时语音,5013 位说话人
数据时长
36700 hours
语种
1 种
采样率
44.1 kHz
发布时间
2025-06
数据集描述
1包含两个子集:22.05 kHz 子集约 36,700 小时(5,013 位说话人)和 44.1 kHz 子集约 31,700 小时(4,631 位说话人)
2数据来源于 LibriVox 有声书项目,原始音频为 48 kHz,降采样至 44.1 kHz FLAC 格式
3提供详细的元数据标注,支持零样本 TTS 训练
4专注于高带宽语音合成研究
5公共领域许可,适用于商业用途(已移除选择退出 ML 使用的说话人)
语种明细
| 语言名称 | 时长 |
|---|---|
| 英语 | 36700 hours |
发布单位