基于 PaddleOCR-VL 0.9B 视觉模型的 PDF → Markdown 转换 web 应用。
把 PDF 论文、手册、扫描件批量转成结构化 Markdown,留住公式、表格和段落层级。基于 PaddleOCR-VL 0.9B 多模态视觉模型 + FastAPI 后端 + 简洁 web UI。
Apache-2.0,适合本地部署。处理速度与准确度均高于纯文本 OCR 路线。
GitHub →