AliMeeting
阿里巴巴发布的中文多通道会议语音数据集,118.75 小时真实会议录音,支持说话人分离和多说话人 ASR
数据时长
119 hours
语种
1 种
采样率
16 kHz
发布时间
2022-01
数据集描述
1来自真实会议场景的录音
2总计 118.75 小时:训练集 104.75 小时,验证集 4 小时,测试集 10 小时
3覆盖多种会议室环境、不同参会人数和不同说话人重叠比例
4使用 8 通道麦克风阵列和头戴式麦克风录制
5为 ICASSP 2022 M2MeT 挑战赛设计
6支持说话人分离和多说话人语音识别任务
语种明细
| 语言名称 | 时长 |
|---|---|
| 普通话 | 119 hours |
发布单位