排名第九、国内第二，DeepSeek V4 凭什么让人又爱又恨？

雷雷峰网2026年5月31日 14:31约 2 分钟阅读↗ 查看原文

主要内容

01古诗词理解平均4.75/5，顶尖
02法律引用零幻觉，准确引导错误用法
03代码生成4.9/5，诊断Bug如法医级别
04会编造不存在的网络梗如“电子呕吐”

背景

DeepSeek V3曾因高性价比和性能引起轰动，V4于4月24日发布，初期评价两极分化。Vals AI测评显示其综合准确率63.87%，但该测评偏向英文/国际场景。本文作者设计了一套针对中文用户场景的测试（古诗词、法律、网络梗、翻译、开发工作流），全面评估V4的实用能力。

为什么值得关注

对AI工具用户和开发者，DeepSeek V4在中文环境下表现突出（古诗词、法律、翻译），代码生成和诊断能力接近顶尖闭源模型，但API价格远低于对手（V4 Pro约$1512/月，Flash约$504/月）。这意味着用户可以用更低成本获得接近顶级模型的核心能力，尤其适合中国开发者日常开发、文档生成、法律合规等场景。但需注意在亚文化、网络梗等模糊领域可能产生幻觉。

🇨🇳

对中国用户与市场

对中文用户利好：V4在中文古诗词、法律引用、政策术语翻译等方面表现优异，且能准确处理“新质生产力”“绿水青山”等中国特色词汇。API价格低廉，降低国内开发者使用门槛。但受限于高端算力，Pro版吞吐有限，且折扣价仅持续至2026年5月。模型在中文网络梗上会编造，需谨慎用于社交分析。

继续关注

⚠尚未确定的部分

·Pro版API折扣价仅持续至2026/5/31，之后可能涨价
·在中文网络梗等模糊领域可能编造不存在的内容
·智能体能力未达顶尖，复杂多步任务可能不够稳定
·与国际顶级闭源模型仍有3-6个月差距

→可采取的行动

·开发者可优先使用V4 Flash作为日常代码助手，成本仅为Pro的三分之一
·在需要极致代码能力或超长上下文时切换V4 Pro
·涉及中文古诗词、法律文书、政策翻译等场景可直接使用V4
·避免将V4用于依赖网络亚文化或模糊梗的社交分析任务

摘记

你失去了整个世界，而世界若无其事。

三份文档完整且结构化，兼顾上手指南与架构说明，是一份高质量的项目交接文档。

#DeepSeek V4#Vals AI#Kimi K2.6#Claude Opus 4.6#GPT-5.4#Gemini 3.1 Pro#Opus 4.7#GLM 5.1#中文大模型#代码生成

🤖 本文根据雷峰网的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。