PaddleOCR

百度飞桨开源 OCR 工具包,适合中文文档、扫描 PDF、表格和版面识别。

详细介绍

PaddleOCR 是基于 PaddlePaddle 的开源 OCR 工具包,支持图片和 PDF 文档识别,可用于文字检测、文字识别、版面分析、表格识别和文档结构化处理。对中文 OCR 支持较好,适合科研文档数字化、扫描资料整理和批量文本提取。

适用场景:中文 OCR、扫描 PDF 识别、表格识别、文档结构化、科研资料数字化

注意:对非常潦草的手写体识别效果仍需具体测试。