Obsidian 插件:Obsidian OCR

Obsidian 插件:Obsidian OCR

插件名片

  • 插件名称:Obsidian OCR
  • 插件作者:Jonas Mohr
  • 插件说明:使用光学字符识别技术在您的图像和 PDF 文件中搜索文本
  • 插件分类:[‘obsidian 插件 ’, ‘readme’]
  • 项目地址:点我访问
  • 国内下载地址:下载安装

概述

使用光学字符识别技术在您的图像和 PDF 文件中搜索文本

Obsidian 插件:Obsidian OCR--概述

原文出处

下面自述文件的来源于 Readme


Readme(翻译)

下面是 obsidian-ocr 插件的自述翻译

Obsidian 插件:Obsidian OCR--Readme(翻译)

Obsidian 插件:Obsidian OCR--Readme(翻译)

Obsidian 插件:Obsidian OCR--Readme(翻译)

Obsidian 插件:Obsidian OCR--Readme(翻译)

Obsidian 插件:Obsidian OCR--Readme(翻译)

Obsidian 插件:Obsidian OCR--Readme(翻译)

Obsidian 插件:Obsidian OCR--Readme(翻译)

Obsidian 插件:Obsidian OCR--Readme(翻译)

⚠️ 仍处于早期开发阶段 ⚠️

Obsidian OCR 允许您在图像和 PDF 中搜索文本。

安装

依赖项

  • tesseract 用于 OCR
  • imagemagick 用于将 pdf 转换为 png 格式
Windows
手动安装

❗确保可执行文件在您的路径中。如果您不知道如何操作,请查看这里:https://www.architectryan.com/2018/03/17/add-to-the-path-on-windows-10/

  • 安装 tesseract
  • 安装 imagemagick
  • 如果您想使用英语以外的其他语言,您需要手动安装它。(非常简单)
自动安装

❗自动安装功能仍处于早期开发阶段,请预期存在错误❗

ℹ️ Obsidian OCR 使用 chocolatey 进行自动安装 ℹ

  • 安装并启用插件
  • 在“设置”中,点击“自动安装”按钮
MacOS
  • 安装 tesseract:brew install tesseract
  • 安装 tesseract-lang:brew install tesseract-lang
  • 安装 imagemagick:brew install imagemagick

对于路径:检查二进制文件的位置,并将其添加到 “/private/etc/paths” 中

(我还将它们添加到了~/.zshrc 中,不确定是否需要)

  • brew list tesseract 在我的情况下:/opt/homebrew/Cellar/tesseract/5.2.0/bin/
  • brew list tesseract-lang 在我的情况下:/opt/homebrew/Cellar/tesseract/5.2.0/bin/
  • brew list imagemagick 在我的情况下:/opt/homebrew/Cellar/imagemagick/7.1.0-43/bin/
Ubuntu
手动安装
  • 运行 sudo apt install -y tesseract-ocr imagemagick
  • 通过安装相应的包(通常命名为 tesseract-ocr-<lang>)来安装所需的任何语言。
自动安装

❗自动安装功能仍处于早期开发阶段。请预期可能会有错误❗

  • 安装并启用插件
  • 在“设置”下,点击“自动安装”按钮
Arch / Manjaro
手动安装
  • 运行 sudo pacman -S tesseract imagemagick
  • 通过安装相应的包(通常命名为 tesseract-data-<lang>)安装所需的任何语言
自动安装

❗自动安装功能仍处于早期开发阶段。请预期可能会有错误❗

  • 安装并启用插件
  • 在“设置”下,点击“自动安装”按钮

如果 Obsidian 是通过 Flatpak 安装运行的(例如在 Pop!_OS 中默认提供的),那么这个插件将无法运行。Flatpak 沙箱会改变文件路径,即使提供了主机访问权限,仍然会出现问题。如果您使用的是 Flatpak 安装,您需要通过其他方法重新安装才能成功使用此插件。

插件安装

  • 只需从社区插件中安装插件即可。

使用方法

  • 启用插件后,您将在右下角看到一个进度条,表示您的保险库正在处理中。 --使用方法
  • 完成后,您可以使用 Search OCR 命令或工具栏中的 放大镜图标 打开搜索菜单。 --使用方法
  • 当向您的保险库添加新的 PDF / PNG 时,文件会自动被搜索文本。
  • 启动 Obsidian 时,您现在将看到另一个进度条,表示所有转录正在被缓存。 --使用方法

设置

Obsidian OCR 提供了多种您可以自行配置的设置。

名称描述默认值
最大 OCR 进程数同时运行的最大 OCR 进程数。增加此值可以加快索引速度,但也会增加 CPU 使用率1
最大缓存进程数同时运行的最大缓存进程数。增加此值可以加快缓存速度,但也会增加 CPU 使用率10
OCR 图片决定是否对图片(.png,.jpg,.jpeg)进行 OCRtrue
OCR PDF决定是否对 PDF(.pdf)进行 OCRtrue
图片密度生成的 PNG 的密度,以 dpi 为单位。增加此值有助于 OCR 较小的文本,但会增加 CPU 使用率300
图片质量生成的 PNG 的质量。增加此值有助于 OCR 较小的文本,但会增加 CPU 使用率98
额外的 imagemagick 参数在将 PDF 转换为 PNG 时传递给 imagemagick 的额外命令行参数
额外的搜索路径在查找外部依赖项时将搜索的额外路径。在安装到自定义目录时非常有用
OCR 提供者将使用的 OCR 提供者。有关提供者的描述,请参见下文NoOp

OCR 提供商

OCR 提供商列表

名称描述
NoOpNoOp(无操作)提供商如其名,什么也不做,只是一个虚拟提供商。要获得真正的 OCR 功能,您必须切换到另一个提供商。
TesseractOCR 提供商使用 tesseract 在您的计算机上本地进行 OCR 文档识别。
Tesseract

默认情况下,Tesseract 提供两种可供选择的语言:engosd

  • osd 不是一种语言,而是代表 方向和脚本检测,因此对我们的使用没有用处。
  • eng 代表英语,如果您的文档是用英语编写的,应选择此选项。

ℹ 切换语言后,只有新索引的文档才会使用新语言。您可以使用 删除所有转录 命令重新索引已添加的文档 ℹ

Tesseract 支持 langsscripts 进行文本识别。

  • Langs 支持单一语言。
  • Scripts 支持具有相似字符的多种语言。例如,拉丁语支持所有基于拉丁字母的语言(英语、德语、意大利语、法语等),但不包括越南语。

自定义 OCR 提供者

要添加自定义的 OCR 提供者,创建一个新的类,该类扩展 OCRProvider 并使用 OCRProviderManager.registerOCRProviders(new MyCustomProvider()) 进行注册。



反馈交流

其他渠道

版权声明