ChildMandarin
面向 3 至 5 岁幼儿的综合性普通话语音数据集,包含 397 位说话人共 41.25 小时对话语音
数据时长
41.25 hours
语种
1 种
采样率
16 kHz
发布时间
2024-09
数据集描述
1总时长 41.25 小时,包含 40,913 条语音,平均语句长度 3.52 秒
2397 位 3 至 5 岁儿童说话人,性别分布均衡
3说话人来自中国 22 个省级行政区,覆盖 34 个省级行政区中的 22 个
4口音分为重(H)、中(M)、轻(L)三级,约 95.97%的说话人为轻口音
5录音设备为智能手机(216 台 Android 和 181 台 iPhone),录音环境为安静室内
6音频格式为 WAV PCM,16kHz 采样率,16 位精度
7采用字符级人工转写,由专业转写人员完成
8数据采集场景为对话式自然交流,家长在场提供情感支持
9划分为训练集(317 人,33.35 小时)、验证集(39 人,3.78 小时)和测试集(41 人,4.12 小时),说话人无重叠
语种明细
| 语言名称 | 时长 |
|---|---|
| 普通话 | 41.25 hours |
发布单位