SenseVoice 是具有音频理解能力的音频基础模型,包括语音识别(ASR)、语种识别(LID)、语音情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)。
支持 MP3, WAV, FLAC, M4A 等常见音频格式。
或拖拽文件至此区域