CN-Celeb
大规模中文名人说话人识别数据集,1000 位说话人覆盖 11 种真实场景,采集自 in-the-wild 环境
数据时长
274 hours
语种
1 种
采样率
16 kHz
发布时间
2019-11
数据集描述
1包含 1,000 位中国名人超过 130,000 条语音,总时长约 274 小时
2覆盖 11 种真实场景:娱乐、采访、歌唱、话剧、电影、vlog、直播、演讲、戏剧、朗诵和广告
3in-the-wild 采集,包含真实环境噪声、多种说话风格、跨时间和跨设备变化
4免费供研究使用
语种明细
| 语言名称 | 时长 |
|---|---|
| 普通话 | 274 hours |
发布单位