97毫秒！百度 PP-OCRv6 把 OCR 带进毫秒时代

雷雷峰网2026年6月15日 16:51约 2 分钟阅读↗ 查看原文

主要内容

PP-OCR 系列是百度文心大模型多模态能力的一部分，前代 PP-OCRv5 已开源，被 UmiOCR、MinerU 等多款工具集成。本次 v6 在轻量化、精度和速度上进一步优化，目标是降低 OCR 部署门槛，尤其适合本地隐私计算。

开发者可免费获得一个极轻量（1.5MB）且高精度的 OCR 模型，支持本地浏览器运行，无需上传数据到云端，对 Agent、文档解析、隐私敏感场景（如教育、医疗）价值显著。同时 v6 刷新多项基准，对比主流多模态大模型 OCR 任务表现更强。

🇨🇳

对中国用户与市场

中文开发者可直接在浏览器或嵌入式设备上部署 PP-OCRv6，无需依赖国外云服务。PaddleOCR 已支持超 110 种语言，服务全球，但需注意国内网络访问 GitHub/HuggingFace 可能存在不便，百度官方提供了 paddleocr.com 网站和 API 替代方案。

⚠尚未确定的部分

→可采取的行动

单图预测最快仅需 97 毫秒

可能是全球唯一可在浏览器环境运行的高精度 OCR 模型

#百度#文心#PP-OCRv6#PaddleOCR#GitHub#HuggingFace#UmiOCR#MinerU#OCR#模型发布

🤖 本文根据雷峰网的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。