Obsidian 插件:Obsidian OCR
插件名片
概述
使用光学字符识别技术在您的图像和 PDF 文件中搜索文本

原文出处
下面自述文件的来源于 Readme
Readme(翻译)
下面是 obsidian-ocr 插件的自述翻译
⚠️ 仍处于早期开发阶段 ⚠️
Obsidian OCR 允许您在图像和 PDF 中搜索文本。
安装
依赖项
tesseract用于 OCRimagemagick用于将 pdf 转换为 png 格式
Windows
手动安装
❗确保可执行文件在您的路径中。如果您不知道如何操作,请查看这里:https://www.architectryan.com/2018/03/17/add-to-the-path-on-windows-10/❗
- 安装 tesseract
- 安装 imagemagick
- 如果您想使用英语以外的其他语言,您需要手动安装它。(非常简单)
- 前往https://github.com/tesseract-ocr/tessdata_fast/
- 下载适用于您的语言的文件(例如,对于德语,请下载 ger.traineddata)
- 将文件移动到
C:\Program Files\Tesseract-OCR\tessdata
自动安装
❗自动安装功能仍处于早期开发阶段,请预期存在错误❗
ℹ️ Obsidian OCR 使用 chocolatey 进行自动安装 ℹ
- 安装并启用插件
- 在“设置”中,点击“自动安装”按钮
MacOS
- 安装 tesseract:
brew install tesseract - 安装 tesseract-lang:
brew install tesseract-lang - 安装 imagemagick:
brew install imagemagick
对于路径:检查二进制文件的位置,并将其添加到 “/private/etc/paths” 中
(我还将它们添加到了~/.zshrc 中,不确定是否需要)
brew list tesseract在我的情况下:/opt/homebrew/Cellar/tesseract/5.2.0/bin/brew list tesseract-lang在我的情况下:/opt/homebrew/Cellar/tesseract/5.2.0/bin/brew list imagemagick在我的情况下:/opt/homebrew/Cellar/imagemagick/7.1.0-43/bin/
Ubuntu
手动安装
- 运行
sudo apt install -y tesseract-ocr imagemagick - 通过安装相应的包(通常命名为
tesseract-ocr-<lang>)来安装所需的任何语言。
自动安装
❗自动安装功能仍处于早期开发阶段。请预期可能会有错误❗
- 安装并启用插件
- 在“设置”下,点击“自动安装”按钮
Arch / Manjaro
手动安装
- 运行
sudo pacman -S tesseract imagemagick - 通过安装相应的包(通常命名为
tesseract-data-<lang>)安装所需的任何语言
自动安装
❗自动安装功能仍处于早期开发阶段。请预期可能会有错误❗
- 安装并启用插件
- 在“设置”下,点击“自动安装”按钮
如果 Obsidian 是通过 Flatpak 安装运行的(例如在 Pop!_OS 中默认提供的),那么这个插件将无法运行。Flatpak 沙箱会改变文件路径,即使提供了主机访问权限,仍然会出现问题。如果您使用的是 Flatpak 安装,您需要通过其他方法重新安装才能成功使用此插件。
插件安装
- 只需从社区插件中安装插件即可。
使用方法
- 启用插件后,您将在右下角看到一个进度条,表示您的保险库正在处理中。

- 完成后,您可以使用
Search OCR命令或工具栏中的放大镜图标打开搜索菜单。
- 当向您的保险库添加新的 PDF / PNG 时,文件会自动被搜索文本。
- 启动 Obsidian 时,您现在将看到另一个进度条,表示所有转录正在被缓存。

设置
Obsidian OCR 提供了多种您可以自行配置的设置。
| 名称 | 描述 | 默认值 |
|---|---|---|
| 最大 OCR 进程数 | 同时运行的最大 OCR 进程数。增加此值可以加快索引速度,但也会增加 CPU 使用率 | 1 |
| 最大缓存进程数 | 同时运行的最大缓存进程数。增加此值可以加快缓存速度,但也会增加 CPU 使用率 | 10 |
| OCR 图片 | 决定是否对图片(.png,.jpg,.jpeg)进行 OCR | true |
| OCR PDF | 决定是否对 PDF(.pdf)进行 OCR | true |
| 图片密度 | 生成的 PNG 的密度,以 dpi 为单位。增加此值有助于 OCR 较小的文本,但会增加 CPU 使用率 | 300 |
| 图片质量 | 生成的 PNG 的质量。增加此值有助于 OCR 较小的文本,但会增加 CPU 使用率 | 98 |
| 额外的 imagemagick 参数 | 在将 PDF 转换为 PNG 时传递给 imagemagick 的额外命令行参数 | |
| 额外的搜索路径 | 在查找外部依赖项时将搜索的额外路径。在安装到自定义目录时非常有用 | |
| OCR 提供者 | 将使用的 OCR 提供者。有关提供者的描述,请参见下文 | NoOp |
OCR 提供商
OCR 提供商列表
| 名称 | 描述 |
|---|---|
| NoOp | NoOp(无操作)提供商如其名,什么也不做,只是一个虚拟提供商。要获得真正的 OCR 功能,您必须切换到另一个提供商。 |
| Tesseract | OCR 提供商使用 tesseract 在您的计算机上本地进行 OCR 文档识别。 |
Tesseract
默认情况下,Tesseract 提供两种可供选择的语言:eng 和 osd。
osd不是一种语言,而是代表方向和脚本检测,因此对我们的使用没有用处。eng代表英语,如果您的文档是用英语编写的,应选择此选项。
ℹ 切换语言后,只有新索引的文档才会使用新语言。您可以使用 删除所有转录 命令重新索引已添加的文档 ℹ
Tesseract 支持 langs 和 scripts 进行文本识别。
Langs支持单一语言。Scripts支持具有相似字符的多种语言。例如,拉丁语支持所有基于拉丁字母的语言(英语、德语、意大利语、法语等),但不包括越南语。
自定义 OCR 提供者
要添加自定义的 OCR 提供者,创建一个新的类,该类扩展 OCRProvider 并使用 OCRProviderManager.registerOCRProviders(new MyCustomProvider()) 进行注册。
反馈交流
其他渠道
版权声明
版权声明:所有 PKMer 文章如果需要转载,请附上原文出处链接。