OpenBMB发布VoxCPM2：免分词多语言语音合成

原标题：OpenBMB/VoxCPM

GGitHub Trending Daily RSS约 2 分钟阅读↗ 查看原文

主要内容

VoxCPM2是OpenBMB在VoxCPM系列上的重大升级，基于MiniCPM-4骨干网络，采用AudioVAE V2编解码。此前VoxCPM-0.5B和1.5版已获得社区广泛关注，新版本在语言覆盖、音频质量和功能上大幅提升。

对于AI工具用户，VoxCPM2提供了一个全开源、可商用的多语言TTS方案，支持零样本声音克隆和基于文本描述的声音设计，部署门槛低（单卡RTX 4090即可实时），且与vLLM-Omni集成可用OpenAI兼容API，适合内容创作、本地化、虚拟助手等场景。

🇨🇳

对中国用户与市场

国内用户可通过ModelScope下载模型权重，支持中文及多种方言。Apache-2.0许可允许商用，但需注意声音克隆可能涉及隐私与合规问题，应标注AI生成内容。

⚠尚未确定的部分

→可采取的行动

#OpenBMB#VoxCPM2#MiniCPM-4#AudioVAE V2#Nano-vLLM#vLLM-Omni#语音合成#多语言TTS#开源模型#声音克隆

🤖 本文根据 GitHub Trending Daily RSS 的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。