LLaSO-Instruct
LLaSO 框架的多任务指令微调数据集,1350 万条样本覆盖 20 项语音任务
数据时长
None
语种
1 种
采样率
16 kHz
发布时间
2025-08
数据集描述
1LLaSO 开源框架的指令微调组件,包含 1350 万条多任务指令样本
2覆盖 20 项任务,分布为语言学任务 52%、语义任务 8%、副语言学任务 40%
3支持三种交互模式:文本指令+音频输入、音频指令+文本输入、纯音频
4音频组成:71% 真实世界音频,29% 合成语音
5数据来源包括 GigaSpeech、LibriSpeech、VoxCeleb1、Common Voice、MELD、CREMA-D 等多种语料库
语种明细
| 语言名称 | 时长 |
|---|---|
| 英语 | None |
发布单位