pdf-extract-api: 结合 OCR 和 LLM 实现高质量的本地文档智能化处理 @CatchtheTornado
# 基于现代 OCR 技术和 @ollama LLM 的 PDF 文档解析 API, 能够将 PDF/图片高精度转换为 Markdown/JSON 格式, 支持数学公式识别、隐私信息删除, 完全本地部署无需云服务, 适合对数据隐私敏感的企业级应用场景。
※ 核心功能
- 可以将任何PDF文档或图片转换为 Markdown 文本或 JSON 结构化文档
-... See more