热门AI公司动态
Token大战中,华为云选择了第三条路|最前线
TL;DR · 一句话结论
华为云在INSPIRE大会上提出Agentic Infra,主打国产算力和生产力提升,发布AICS灵衢智算集群、ModelArts Next等新品,联合20余家模型厂商推出“百模千态”计划,落地医疗病理、具身智能等行业场景。
主要内容
- 01华为云发布Agentic Infra新范式,不拼Token单价和调用量
- 02AICS灵衢智算集群支持10万卡,时延<10ms,吞吐500万Token/秒
- 03ModelArts Next含MaaS路由,成本平均降低20%
- 04瑞金医院病理大模型已上线,支持云端诊断
- 05华为云强调“第二个算力平面”,坚持国产化算力路线
背景
国内云厂商自2024年起围绕Token价格战激烈竞争,推理算力毛利率一度为负。华为云凭借昇腾生态,在DeepSeek R1等模型推理上追平英伟达H800性能,选择以国产算力和行业落地为差异化方向。
为什么值得关注
国内AI用户常面临算力受限和模型成本压力。华为云的Agentic Infra提供了一条不依赖英伟达的低成本自主算力路径,尤其适合金融、医疗、政企等数据安全要求高的场景,其行业级智能体平台和开源版本也降低了中小企业开发门槛。
🇨🇳
对中国用户与市场
华为云强化国产算力生态,对受制裁影响的用户和开发者是重要补充。需警惕其与海外模型/框架兼容性风险,以及昇腾生态的早期阶段可能带来迁移成本。
继续关注
⚠尚未确定的部分
- ·昇腾生态成熟度不及英伟达CUDA,长期兼容性存疑
- ·Agentic Infra落地效果需依赖更多行业验证案例
- ·华为云“最开放的云”与实际锁定用户的效果可能矛盾
→可采取的行动
- ·关注华为云AgentArts智能体平台及开源版openJiuwen,评估迁移成本
- ·有国产算力需求的用户可测试AICS集群在自身模型上的推理性能
- ·医疗、金融等敏感行业用户可考察华为云机密推理方案的安全性
摘记
华为云要做硅基黑土地。
在国产化算力供应受限的情况下,华为云现在不太在乎Token总量是多少。
#华为云#周跃峰#Agentic Infra#AICS灵衢智算集群#ModelArts Next#智果AgentArts#openJiuwen#瑞金医院#国产算力#Token大战
🤖 本文根据 36氪 AI 的 RSS 内容整理,并由 AI 辅助提炼要点。完整上下文请以 原文 为准。