VietMed
越南语医疗领域语音识别数据集,16 小时标注语音及 2200 小时无标注语音,覆盖所有 ICD-10 疾病组
数据时长
2216 hours
语种
1 种
采样率
8 kHz
发布时间
2024-04
数据集描述
1包含 16 小时标注医疗语音、1000 小时无标注医疗语音和 1200 小时无标注通用领域语音
2覆盖所有 ICD-10 疾病组,包含越南所有口音
3提供预训练和微调模型
4发表于 LREC-COLING 2024(Oral)
语种明细
| 语言名称 | 时长 |
|---|---|
| 越南语 | 2216 hours |
发布单位