#OCR | 极客分享

专注分享各种高质量网站、工具、APP、开源项目等一切好玩的东西🚀，以及偶尔开开车🚗

🔍内容索引 @GeeksoBot
💬加入话题 @igeekshare
📮广告合作 @Geekshare_bot
🌐网站：https://geekshare.org/

14:14 · Jan 13, 2026 · Tue

#PDF #工具 #OCR #deepseek

⚙️ PDF Craft - 一个用于将 PDF 转换为 Markdown 或 EPUB 的工具

它基于 DeepSeek OCR 进行文档识别，支持复杂内容识别，能自动识别文档结构，过滤干扰信息，妥善处理脚注、公式、表格等元素

📮投稿 📢频道 💬群聊 🔎索引

PDF 工具 OCR deepseek

14:12 · Apr 29, 2025 · Tue

#OCR #PDF #工具

⭐ OCRmyPDF - 为扫描版 PDF 添加 OCR 文本层

扫描版的 PDF 一般难以搜索、复制，OCRmyPDF 可以将其转化为可搜索、可复制的文档

目前该工具只能命令行操作，Windows 需安装 Python 和 TesseractOCR 才能使用

📑相关阅读

 Zerox - 一款开源的 AI OCR 工具

📮投稿 📢频道 💬群聊 🔎索引

OCR PDF 工具

08:32 · Mar 15, 2025 · Sat

#OCR #开源 #AI

⭐ Zerox - 一款开源的 AI OCR 工具

Zerox可以将 PDF、DOCX、图片等格式的文档转换为 Markdown

它基于 AI 视觉模型（如 GPT-4o-mini 等）实现 OCR 并直接生成结构化内容

📑相关阅读

Mistral AI 发布全球最强 OCR：每解析1000 页费用为1 美元

📮投稿 📢频道 💬群聊 🔎索引

OCR 开源 AI

02:24 · Mar 9, 2025 · Sun

#AI #OCR

⭐ Mistral OCR PDF 处理工具

该项目基于 Mistral AI 的 OCR (光学字符识别) 功能实现从 PDF 文档中提取文本内容和图像，并将结果保存为 Markdown 格式

📑相关阅读

Mistral AI 发布全球最强 OCR：每解析1000 页费用为1 美元

📮投稿 📢频道 💬群聊 🔎索引

GitHub

GitHub - nicekate/mistral-ocr

Contribute to nicekate/mistral-ocr development by creating an account on GitHub.

AI OCR

14:10 · Mar 8, 2025 · Sat

#AI #OCR

⭐ Mistral AI 发布全球最强 OCR：每解析1000 页费用为1 美元

免费试用： chat.mistral.ai/chat
API： console.mistral.ai/home

与传统的 OCR API 不同，Mistral OCR 是一款多模态 API，它不仅可以识别文本中是否嵌入了插图或照片，还会为这些图形元素创建边界框，并将它们包含在输出中。

表格+数字、数学公式、不规则PDF、带水印文本通通不在话下！

📮投稿 📢频道 💬群聊 🔎索引

AI OCR

09:38 · Mar 6, 2025 · Thu

#开源 #OCR #PDF #AI #PDF

⭐ OlmOCR - 从 PDF 中提取文字的开源 AI 工具

🐙

开源页面

OlmOCR 基于 Qwen2-VL-7B-Instruct 模型，用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。

完全开源，可以在本地 Nvidia GPU（4090以上）上运行

📮投稿 📢频道 💬群聊 🔎索引

开源 OCR PDF AI PDF

12:44 · Jun 16, 2023 · Fri

#网站 #工具 #OCR

OLOCR - 一个免费的在线 OCR 文字识别工具

📄这个工具是在浏览器中运行的，文件不会上传云端，所以第一次打开会比较慢。支持多语言识别，同时支持PDF和图片识别

📮投稿 📢频道 💬群聊

网站工具 OCR

03:18 · Nov 9, 2022 · Wed

#开源 #免费 #工具 #OCR

Umi-OCR - 一款开源离线的OCR工具

⬇️蓝奏云下载[作者]

📃截屏/批量导入图片，支持多国语言、合并段落、竖排文字。可排除水印区域，提取干净的文本

📢频道：@geekshare
💬群组：@igeekshare
📮投稿：@Geekshare_bot

开源免费工具 OCR