PaddleOCR 3.6发布：轻量OCR工具包

原标题：PaddlePaddle/PaddleOCR

GGitHub Trending Daily RSS约 2 分钟阅读↗ 查看原文

主要内容

PaddleOCR是百度开源的OCR工具包，定位为文档智能解析引擎。最新3.6.0版本强化了视觉语言模型(PaddleOCR-VL)和结构化转换能力，旨在将PDF、图片等非结构化数据高效转为LLM可用的结构化数据。

PaddleOCR是构建RAG应用和AI工作流的关键组件。它解决了非结构化文档（PDF、图片）向结构化数据转换的痛点，且支持超100种语言、轻量化部署，可大幅降低AI应用开发中数据预处理的门槛。

🇨🇳

对中国用户与市场

国内用户可免费使用，支持国产硬件（昆仑芯XPU、NPU），且提供详细中文文档。但需注意PaddlePaddle框架依赖，部分模型可能需自行下载。

⚠尚未确定的部分

→可采取的行动

#PaddleOCR#PaddleOCR-VL#PP-OCRv5#PP-StructureV3#Dify#RAGFlow#Cherry Studio#百度#OCR#文档解析

🤖 本文根据 GitHub Trending Daily RSS 的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。