每个工具都标注国内可用、中文支持、价格区间,按场景与需求筛选。
Stable Audio 3 是 Stability AI 推出的音频生成工具,可根据文本描述生成高质量音乐和音效。
Gemini 3.1 Flash TTS 是谷歌推出的文本转语音工具,支持快速生成自然语音。
Grok的语音模式,支持快速思考和实时对话。
Voxtral TTS 是一款高质量文本转语音工具,支持多种语言和自然发音。