专注分享各种高质量网站、工具、APP、开源项目等一切好玩的东西🚀,以及偶尔开开车🚗

🔍内容索引 @GeeksoBot
💬加入话题 @igeekshare
📮广告合作 @Geekshare_bot
#OCR #开源 #AI

Zerox - 一款开源的 AI OCR 工具

Zerox可以将 PDF、DOCX、图片等格式的文档转换为 Markdown

它基于 AI 视觉模型(如 GPT-4o-mini 等)实现 OCR 并直接生成结构化内容

📑相关阅读

Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元

📮
投稿 📢频道 💬群聊 🔎索引
#AI #OCR

Mistral AI 发布全球最强 OCR:每解析1000 页费用为1 美元

免费试用: chat.mistral.ai/chat
API: console.mistral.ai/home

与传统的 OCR API 不同,Mistral OCR 是一款多模态 API,它不仅可以识别文本中是否嵌入了插图或照片,还会为这些图形元素创建边界框,并将它们包含在输出中。

表格+数字、数学公式、不规则PDF、带水印文本通通不在话下!

📮投稿 📢频道 💬群聊 🔎索引
#开源 #OCR #PDF #AI #PDF

OlmOCR - 从 PDF 中提取文字的开源 AI 工具

🐙 开源页面

OlmOCR 基于 Qwen2-VL-7B-Instruct 模型,用 GPT-4o 标记了 25 万页 PDF 对其进行了微调。

完全开源,可以在本地 Nvidia GPU(4090以上) 上运行

📮投稿 📢频道 💬群聊 🔎索引
#网站 #工具 #OCR

OLOCR - 一个免费的在线 OCR 文字识别工具

📄这个工具是在浏览器中运行的,文件不会上传云端,所以第一次打开会比较慢。支持多语言识别,同时支持PDF和图片识别

📮投稿 📢频道 💬群聊
#开源 #免费 #工具 #OCR

Umi-OCR - 一款开源离线的OCR工具

⬇️
蓝奏云下载[作者]

📃截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本

📢频道:@geekshare
💬群组:
@igeekshare
📮投稿:
@Geekshare_bot
 
 
Back to Top