未连接

🎵 预置音色合成

使用内置精品音色,通过 mimo-v2.5-tts 模型快速生成语音

音色配置
自然语言风格指令 (可选,放在 user 消息)

💡 可用"导演模式":【角色】【场景】【指导】三维度描述。留空则不传 user 消息。

快捷风格标签 (点击插入到合成文本开头)
开心 悲伤 愤怒 恐惧 兴奋 怅然 温柔 高冷 活泼 慵懒 磁性 沙哑 夹子音 御姐音 东北话 四川话 粤语 台湾腔 孙悟空 林黛玉 唱歌
合成文本 *

⚠️ 合成文本放在 assistant 消息中;若用唱歌风格,请在文本最前加 (唱歌) 标签

0:00
0:00

🎨 音色设计

通过文本描述定制专属音色,使用 mimo-v2.5-tts-voicedesign 模型

音色描述 *(必填,放在 user 消息)

💡 包含:性别年龄 + 音色质感 + 情绪语气 + 语速节奏。1-4句为佳,避免冲突描述。

温柔女声 沧桑老先生 ASMR 女声 纪录片旁白 俄国腔大叔 深夜电台DJ
合成文本 *(放在 assistant 消息)

💡 合成文本应与音色描述风格匹配,才能获得最佳效果。不支持 (唱歌) 标签。

0:00
0:00

🔊 声音克隆

上传音频样本复刻任意音色,使用 mimo-v2.5-tts-voiceclone 模型

参考音频样本 *
点击上传或拖拽音频文件
支持 MP3、WAV,Base64 后不超过 10MB
或实时录音
00:00 待机
💡 录制完成后自动设为参考音频,可直接点击「克隆并合成」
风格指令 (可选,放在 user 消息)
细粒度音频标签 (点击插入到合成文本)
紧张 疲惫 激动 委屈 撒娇 震惊 深呼吸 叹气 轻笑 哽咽 颤抖 沙哑
合成文本 *(放在 assistant 消息)
0:00
0:00

📋 请求日志

记录所有 API 请求的详细信息,包括请求头、请求体、响应状态与错误详情

完整请求日志
— 等待请求 —