SenseVoice-Small 语音识别

SenseVoice 是具有音频理解能力的音频基础模型,包括语音识别(ASR)、语种识别(LID)、语音情感识别(SER)和声学事件分类(AEC)或声学事件检测(AED)。

支持 MP3, WAV, FLAC, M4A 等常见音频格式。

upload_file 上传音频 尚未选择文件

或拖拽文件至此区域

自动检测
中文
English
粤语
日本語
한국어
无语音
纯净文本
原始富文本
Emoji 格式
高级设置

开始识别