19.7K Star!厉害了,推荐一款无与伦比的开源OCR文字识别工具!

图片[1]-19.7K Star!厉害了,推荐一款无与伦比的开源OCR文字识别工具!-山海云端论坛

在日常工作中,特别是在自动化测试等场景下,经常需要处理验证码识别、文本识别和图像识别等任务。市面上虽然有许多识别工具,但质量和准确性参差不齐。

今天我要向大家推荐的是一个开源OCR项目:Umi-OCR。这个项目功能强大,而且可以离线使用,目前已经获得了超过19.7K的星标,足以显示其受欢迎程度。

1、项目介绍

图片[2]-19.7K Star!厉害了,推荐一款无与伦比的开源OCR文字识别工具!-山海云端论坛

Umi-OCR是基于PaddleOCR开发的,使用Python编写,目前仅支持Windows平台,但跨平台版本正在筹备中。

项目地址:

GitHub地址:https://github.com/hiroi-sora/Umi-OCR

Gitee地址:https://gitee.com/mirrors/Umi-OCR.git

项目结构:

<code>Umi-OCR ├─ Umi-OCR.exe └─ UmiOCR-data ├─ main.py ** ├─ version.py ** ├─ site-packages │ └─ python包 ├─ runtime │ └─ python解释器 ├─ qt_res ** │ └─ 项目qt资源,包括图标和qml源码 ├─ py_src ** │ └─ 项目python源码 ├─ plugins │ └─ 插件 └─ i18n ** └─ 翻译文件</code>

项目特点:

  • 免费: 所有代码开源,完全免费。
  • 方便: 解压即用,离线运行,无需网络。
  • 高效: 自带高效率的离线OCR引擎,内置多种语言识别库。
  • 灵活: 支持命令行、HTTP接口等多种调用方式。
  • 功能: 截图OCR、批量OCR、PDF识别、二维码识别、公式识别等。

2、项目使用

可以直接在releases中选择合适的版本进行下载:

  • GitHub: https://github.com/hiroi-sora/Umi-OCR/releases/latest
  • 蓝奏云: https://hiroi-sora.lanzoul.com/s/umi-ocr
  • Source Forge: https://sourceforge.net/projects/umi-ocr

这个软件无需安装,解压后,点击 Umi-OCR.exe 即可启动程序。

图片[3]-19.7K Star!厉害了,推荐一款无与伦比的开源OCR文字识别工具!-山海云端论坛

截图OCR:这个功能适用于一些无法复制文本的网页,速度快,准确率高。

图片[4]-19.7K Star!厉害了,推荐一款无与伦比的开源OCR文字识别工具!-山海云端论坛

批量OCR:如果需要一次性识别多张图片,这个功能值得拥有。只需将所有图片导入,然后点击开始任务即可批量识别。

图片[5]-19.7K Star!厉害了,推荐一款无与伦比的开源OCR文字识别工具!-山海云端论坛

文档识别:支持导入多种格式的文件,如pdf、xps、epub等,可对扫描件进行OCR,或提取原有文本。

图片[6]-19.7K Star!厉害了,推荐一款无与伦比的开源OCR文字识别工具!-山海云端论坛

支持命令行和HTTP接口调用。命令行使用简单,HTTP接口需先勾选开启HTTP服务,具体使用方法可参考文档。

  • https://gitee.com/mirrors/Umi-OCR/blob/main/docs/README_CLI.md
  • https://gitee.com/mirrors/Umi-OCR/blob/main/docs/README_HTTP.md
© 版权声明
THE END
喜欢就支持一下吧
点赞8 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容