🎵 预置音色合成
使用内置精品音色,通过 mimo-v2.5-tts 模型快速生成语音
音色配置
自然语言风格指令 (可选,放在 user 消息)
💡 可用"导演模式":【角色】【场景】【指导】三维度描述。留空则不传 user 消息。
快捷风格标签 (点击插入到合成文本开头)
开心
悲伤
愤怒
恐惧
兴奋
怅然
温柔
高冷
活泼
慵懒
磁性
沙哑
夹子音
御姐音
东北话
四川话
粤语
台湾腔
孙悟空
林黛玉
唱歌
合成文本 *
⚠️ 合成文本放在 assistant 消息中;若用唱歌风格,请在文本最前加 (唱歌) 标签
0:00
0:00
🎨 音色设计
通过文本描述定制专属音色,使用 mimo-v2.5-tts-voicedesign 模型
音色描述 *(必填,放在 user 消息)
💡 包含:性别年龄 + 音色质感 + 情绪语气 + 语速节奏。1-4句为佳,避免冲突描述。
温柔女声
沧桑老先生
ASMR 女声
纪录片旁白
俄国腔大叔
深夜电台DJ
合成文本 *(放在 assistant 消息)
💡 合成文本应与音色描述风格匹配,才能获得最佳效果。不支持 (唱歌) 标签。
0:00
0:00
🔊 声音克隆
上传音频样本复刻任意音色,使用 mimo-v2.5-tts-voiceclone 模型
参考音频样本 *
点击上传或拖拽音频文件
支持 MP3、WAV,Base64 后不超过 10MB
或实时录音
00:00
待机
💡 录制完成后自动设为参考音频,可直接点击「克隆并合成」
风格指令 (可选,放在 user 消息)
细粒度音频标签 (点击插入到合成文本)
紧张
疲惫
激动
委屈
撒娇
震惊
深呼吸
叹气
轻笑
哽咽
颤抖
沙哑
合成文本 *(放在 assistant 消息)
0:00
0:00
📋 请求日志
记录所有 API 请求的详细信息,包括请求头、请求体、响应状态与错误详情
完整请求日志
— 等待请求 —