Web前端开发网

fly63.com

首页 资源 工具 文章 教程 栏目
  • 在线搜索
  • 文章标签
  • 文章投稿
  • 关于我们

资源分类

AI智能 酷站推荐 招聘/兼职 框架/库 模块/管理 移动端UI框架 Web-UI框架 Js插件 Jquery插件 CSS相关 IDE环境 在线工具 图形动效 游戏框架 node相关 调试/测试 在线学习 社区/论坛 博客/团队 前端素材 图标/图库 建站资源 设计/灵感 IT资讯
网站收录 / 问题反馈

MonkeyOCR

分享
复制链接
新浪微博
QQ 好友

扫一扫分享

GitHub:https://github.com/Yuliang-Liu/MonkeyOCR
描述信息:专注于文档解析的OCR项目
GitHub
MonkeyOCR 是一个专注于文档解析的项目,采用了 Structure-Recognition-Relation (SRR) 三元组范式,在简化模块化方法的多工具 pipeline 的同时,避免了使用大型多模态模型处理全页文档的低效问题。


核心特点

  1. 性能优势:
    • MonkeyOCR-pro-1.2B 在中文文档上的表现超过 MonkeyOCR-3B 7.4%
    • MonkeyOCR-pro-1.2B 相比 MonkeyOCR-pro-3B 速度提升约 36%,而性能仅下降约 1.6%
    • 在 olmOCR-Bench 上,MonkeyOCR-pro-1.2B 优于 Nanonets-OCR-3B 7.3%
    • 在 OmniDocBench 上,MonkeyOCR-pro-3B 在中英文文档上均取得最佳整体性能,超过了包括 Gemini 2.0-Flash、GPT-4o 等在内的闭源和超大型开源 VLMs
  2. 推理速度:
    不同 GPU 上的处理速度(页 / 秒)有详细测试数据,例如在 4090 GPU 上,MonkeyOCR-pro-3B 处理 1000 页 PDF 的速度可达 1.006 页 / 秒,MonkeyOCR-pro-1.2B 则为 0.683 页 / 秒(3090 GPU 上)。


部署方式

支持多种部署方式:
  • 本地部署
  • Docker 部署
  • WSL2 + Docker 部署(针对 Windows 用户)


模型下载

可通过 HuggingFace 或 ModelScope 下载模型,项目提供了专门的下载脚本 tools/download_model.py 方便获取模型权重。

仅供个人学习参考/导航指引使用,具体请以第三方网站说明为准,本站不提供任何专业建议。如果地址失效或描述有误,请联系站长反馈~感谢您的理解与支持!

链接: https://web.fly63.com/nav/4242

更多»
热门资源
5118站长工具
关键词、长尾词挖掘,AI驱动的SEO内容创作平台
官网
fly63工具箱
简单、易用、便捷的在线工具
官网
GitHub
remove.bg
消除图片背景:100% 自动 – 只需 5 秒
官网
retoucher
在线AI智能抠图去背景工具
官网
图片压缩工具
免费减小图片大小,支持JPG/PNG/Webp多种格式
官网
图片格式转换
在线图像转换器,支持JPG/PNG/WebP多种格式
官网
老照片修复神器
AI还原褪色和损坏的照片,在线一键修复老照片
官网
AI图片处理
一站式AI工具平台,为工作和学习提供智能解决方案
官网
证件照生成器
在线制作标准证件照、换底色、AI智能生成
官网
云雾 API
为开发者提供快速、便捷的Web API接口调用方案
官网
阿里云DataV
地图数据
官网
Apifox
API 文档、API 调试、API Mock、API 自动化测试一体化协作平台
官网
类似于MonkeyOCR的资源
Pake
简单的用 Rust 打包网页生成很小的 Mac App
点击进入
GitHub
FileUnzip
在线文件解压缩工具,支持各种文件格式
官网
Repomix
将整个代码库打包成一个AI友好的单个文件
官网
GitHub
蜜蜂剪辑
简单的操作,丰富的功能,全民都会用的视频工具
官网
AList
一个支持多存储的文件列表程序,使用 Gin 和 Solidjs
官网
GitHub
PakePlus
无需环境搭建,免费将任何网页打包成exe安装包
官网
WeKnora
基于大语言模型(LLM)的文档理解与语义检索框架
官网
GitHub
Pot
一个跨平台的划词翻译软件
官网
GitHub
目录

手机扫一扫预览

首页 技术导航 在线工具 技术文章 教程资源 前端标签 AI工具集 前端库/框架

Copyright © 2018 Web前端开发网 All Rights Reserved. 分享编程学习资源(教程/框架/库)、在线工具、技术教程、内容以学习参考为主,助您解决各类实际问题,快速提升专业能力。