MagicData-RAMC
180 小时高质量富标注普通话对话语音数据集,覆盖 15 个多样化领域
数据时长
180 hours
语种
1 种
采样率
16 kHz
发布时间
2022-03
数据集描述
1包含 180 小时对话语音,由母语为普通话的说话人通过手机录制
2对话分为 15 个领域并标注主题标签,涵盖科技到日常生活
3提供精确转写和说话人语音活动时间戳
4支持语音识别、说话人分离、主题检测、关键词搜索、语音合成等任务
语种明细
| 语言名称 | 时长 |
|---|---|
| 普通话 | 180 hours |
发布单位