在日常工作中,特别是在自动化测试等场景下,经常需要处理验证码识别、文本识别和图像识别等任务。市面上虽然有许多识别工具,但质量和准确性参差不齐。
今天我要向大家推荐的是一个开源OCR项目:Umi-OCR。这个项目功能强大,而且可以离线使用,目前已经获得了超过19.7K的星标,足以显示其受欢迎程度。
1、项目介绍
Umi-OCR是基于PaddleOCR开发的,使用Python编写,目前仅支持Windows平台,但跨平台版本正在筹备中。
项目地址:
GitHub地址:https://github.com/hiroi-sora/Umi-OCR
Gitee地址:https://gitee.com/mirrors/Umi-OCR.git
项目结构:
<code>Umi-OCR ├─ Umi-OCR.exe └─ UmiOCR-data ├─ main.py ** ├─ version.py ** ├─ site-packages │ └─ python包 ├─ runtime │ └─ python解释器 ├─ qt_res ** │ └─ 项目qt资源,包括图标和qml源码 ├─ py_src ** │ └─ 项目python源码 ├─ plugins │ └─ 插件 └─ i18n ** └─ 翻译文件</code>
项目特点:
- 免费: 所有代码开源,完全免费。
- 方便: 解压即用,离线运行,无需网络。
- 高效: 自带高效率的离线OCR引擎,内置多种语言识别库。
- 灵活: 支持命令行、HTTP接口等多种调用方式。
- 功能: 截图OCR、批量OCR、PDF识别、二维码识别、公式识别等。
2、项目使用
可以直接在releases中选择合适的版本进行下载:
- GitHub: https://github.com/hiroi-sora/Umi-OCR/releases/latest
- 蓝奏云: https://hiroi-sora.lanzoul.com/s/umi-ocr
- Source Forge: https://sourceforge.net/projects/umi-ocr
这个软件无需安装,解压后,点击 Umi-OCR.exe 即可启动程序。
截图OCR:这个功能适用于一些无法复制文本的网页,速度快,准确率高。
批量OCR:如果需要一次性识别多张图片,这个功能值得拥有。只需将所有图片导入,然后点击开始任务即可批量识别。
文档识别:支持导入多种格式的文件,如pdf、xps、epub等,可对扫描件进行OCR,或提取原有文本。
支持命令行和HTTP接口调用。命令行使用简单,HTTP接口需先勾选开启HTTP服务,具体使用方法可参考文档。
- https://gitee.com/mirrors/Umi-OCR/blob/main/docs/README_CLI.md
- https://gitee.com/mirrors/Umi-OCR/blob/main/docs/README_HTTP.md
© 版权声明
THE END
暂无评论内容