MinerU
开源文档解析工具,可将 PDF、图片和 Office 文档转为 Markdown / JSON 等结构化结果。
详细介绍
MinerU 是面向文档智能解析的开源工具,适合把 PDF、图片、论文、报告和办公文档解析成机器可读的 Markdown、JSON 等格式。它可用于科研资料结构化、PDF 内容提取、文档转 Markdown 和知识库构建。
适用场景:PDF 解析、论文转 Markdown、文档结构化、表格提取、科研资料整理
注意:复杂版面、公式和表格的识别效果需要结合具体文档测试。
