Obsidian 插件:【Readme】Text Analysis

Obsidian 插件:【Readme】Text Analysis

插件名片

  • 插件名称:Text Analysis
  • 插件作者:Miha Kralj
  • 插件说明:实时文本分析,涵盖超过 30 个指标,包括可读性、结构和复杂性。
  • 插件分类:[‘obsidian 插件 ’, ‘readme’]
  • 项目地址:点我访问
  • 国内下载地址:下载安装

概述

实时文本分析,涵盖超过 30 个指标,包括可读性、结构和复杂性。

原文出处

下面自述文件的来源于 Readme


Readme(翻译)

下面是 textanalysis 插件的自述翻译

Obsidian 插件:【Readme】Text Analysis--Readme(翻译) Obsidian 插件:【Readme】Text Analysis--Readme(翻译)

Obsidian 插件:【Readme】Text Analysis--Readme(翻译)

黑曜石文本分析插件

提供实时文本分析和反馈,专注于可读性、结构和风格。该插件集成了几个知名的可读性指标,确保对文本进行全面评估。对于希望提高书面内容的清晰度和吸引力的作家、编辑和教育工作者来说,这是一个必不可少的工具。

可读性指标

字符计数

在文本中计算字符的总数。删除所有的 Markdown 格式,并计算所有剩余的字符(包括空格)。较高的字符计数通常意味着更长、更复杂的写作。大多数文本的字符数范围从几百到几千个字符不等。

字母计数

指示文本中可见字形的数量,不包括空格和其他不可见字符。随着字母(字形)的增加,文本往往会变得更长和更复杂。大多数文本的字母(字形)数量在几百到几千之间。

字数统计

反映的是 Unicode 单词的总数,不包括撇号、连字符或数字。更高的字数表示更长、更高级的写作。理想的清晰文本在深度和简洁之间保持平衡,使用 100-500 个单词。大多数发表的写作范围在 300-5,000 个单词之间。

句子数量

显示文本中有多少句子。句子太多会使读者感到不知所措,而句子太少会降低连贯性。写得好的文本平均每句有 10-20 个单词,15-25 个句子。理想的可读性目标是每 100 个单词 3-4 个句子。

段落计数

指示文本结构组织;频繁的段落通过更好地分离思想来提高可读性。段落计数在很大程度上取决于整体文本大小,但良好的可读性应该平均每段 3-5 句或 50-100 个字,至少有 4-5 个段落。

音节计数

检测并计算文本中的所有音节;该算法是针对英语语言开发的,可能会对其他语言返回不正确的计数。英语语言中的理想段落使用 150-750 个音节。大多数出版的写作范围在 450-7,500 个音节之间。

每句平均词数

根据句子长度显示句子复杂性。每句至少 12-15 个词对于流畅阅读理解最为有利。英语中理想的清晰度平均每句在 20-25 个词以下。每句超过 30 个词的话会显示出困难的迹象。

每个单词的平均音节数

表示单词的复杂程度。平均每个单词有 1.5 个音节的英文文本阅读起来最清晰,理想的文本应该以 1-2 个音节的单词为目标的 85% 以上。每个单词的音节数超过 2.5 通常会导致阅读难度增加和可读性降低。

每个单词的平均字符数

提示阅读易度;3-6 个字符的短单词最大程度地提高清晰度。理想的文本平均每个单词 4-5 个字符。较高的平均值可能表明冗长、专业化的词汇,可能会阻碍理解。

难词比例

显示文本中三个或更多音节的单词数量。较低的百分比,最多 5-10% 的难词,有助于更容易阅读。通过用简单的措辞替换专业术语,通常可以减少长多音节单词的数量。

句子复杂性

计算每个句子的平均从句数量,以衡量句法复杂性。理想的复杂性范围是平均 1.5-2.0 个从句 - 具有足够的变化但不会使读者感到不知所措。得分超过 3.0 意味着句子密集且带有难以理解的嵌套从句。每个句子平均从句数量接近 2.0 有助于保持文本易于理解。

词汇多样性(唯一词)

衡量文本中使用的词汇的多样性。它被计算为找到的唯一单词的数量。在总共 300-500 个单词中使用 200-300 个唯一单词可以在词汇深度和可接近性之间取得平衡,这是基于典型成年人英语识字水平的。词汇多样性与单词数量的比率应该在 0.4-0.6 左右。较低的结果,如 0.1-0.3,表示常用词(如“the”、“it”、“and”等)被大量重复使用。

弗莱施阅读易度

使用单词长度和句子长度因素在 100 分制上对文本进行评分。得分越高表示阅读越容易。60-70 分代表着 13-15 岁青少年容易理解的简单语言。理想的目标文本应该以 60-70 的阅读易度为目标。得分越低意味着更困难、更复杂的段落。

弗莱施阅读难度

将阅读容易度转换为相当于美国年级水平,较低的结果意味着更容易理解。理想的文本应该针对 7.0-8.0 年级水平的阅读难度,或者容易度为 60-70。得分高于 10.0 年级水平的文本需要大学水平的读写能力。

Flesch-Kincaid Grade Level

将单词音节和句子长度转换为大约需要理解文本的美国年级水平。理想的目标文本应该瞄准 7.0-8.0 年级水平。更容易理解的文件得分低于 6.0,而更高级的文件范围在 10.0 以上的年级水平。

冈宁雾指数

根据句子长度和复杂词语的百分比生成一个美国年级水平分数。针对 7.0-8.0 雾指数的文本具有良好的可读性。更容易理解的文档得分低于 6.0。高于 10.0 表示大学水平的难度。

SMOG 指数

简单的胡言乱语测量(SMOG)仅基于多音节词数量估计年级水平,并且特别适用于技术写作。具有 6.0 至 8.0 的 SMOG 指数的文本对于普通美国成年人来说很容易阅读。理想的一般论文应该以 9.0-12.0 的 SMOG 指数为目标。16.0 以上的阅读标志着高级学术复杂性。

预测等级

使用平均句子长度对文本进行评分。其准确性更有限,但仍然根据措辞提供了概念密度的有用估计。为了便于理解的理想句子应该针对 8.0-10.0 年级。更高的水平表示更长、更复杂的句子。

自动可读性指数

通过字符/单词和句子语法复杂性(单词/句子)平衡单词难度。目标指数为 7.0-8.0,相当于广泛理解的一般受众沟通。低于 5.0 的分数表示基本/简单的写作,而高于 10.0 则表示高级词汇和短语复杂性。

Coleman-Liau 指数

使用每 100 个单词的字符数/单词数和句子作为输入的简化估算。理想的目标文本应该瞄准 7.0-8.0 的分数。低于 5.0 意味着单词和句子结构简单,而高于 10.0 意味着高级、专业的沟通。

林西尔写作

测量仅取决于句子长度和多音节词汇量。对于一般受众来说,理想值应在 7-8 年级范围内,标志着从基础到高级读写能力的过渡。得分超过 10 的文本表示非常复杂和专业化的词汇选择,可能限制了广泛理解。

新的戴尔 - 查尔分数

强调单词难度而不是句子语法因素。根据美国年级标准评分,得分越高意味着通过复杂的词汇和措辞更难理解。低于 6 年级的分数表示使用基础词汇的非常基础的写作。而高于 10 年级则表示极其高级的写作。

Powers Sumner Kearl (PSK) 等级

这是一种专门设计用于评估儿童文学的可读性指标,根据句子长度和单词难度估算适合美国学校年级水平。它评估每个单词的音节数和每个句子的单词数。理想的 PSK 分数与目标年龄组相匹配,较低的分数表示适合年幼读者的简单语言。

Rix 可读性评分

一种全面的文本可读性评分算法,考虑了词汇、语义、句子结构和连贯性以及概念密度的变化。文本评分在 7.0-9.0 之间适合一般受众。更容易理解的文件评分低于 7.0,而更困难的文件超过 9.0,表明写作最适合专门受过教育的读者。

Rix 难度等级

一个用于 Rix 可读性公式的难度衡量指标,根据文本难度返回“简单”、“适中”或“复杂”字符串。

Lix 可读性公式

一种瑞典可读性/复杂度算法,根据长单词和句子提供文本的年级水平估计。理想的一般受众写作应该在 Lix 标度上达到 8.0-12.0。得分超过 25 表示极高的难度和狭窄的理解。

Lix 难度公式

与 Lix 可读性公式相对应的难度公伴。返回难度等级 ’ 非常容易 ’、’ 容易 ’、’ 中等 ’、’ 困难 ’、’ 非常困难 ‘。

年级水平(共识)

将多个年级水平公式的预测结合起来的综合评估。共识平衡了个别指标的弱点,以估计整体阅读难度。目标写作应针对 7-8 年级(得分)的美国年级水平,适合广泛有文化素养的成年人。

可读性评级

将文本的可读性评分翻译成字母等级,从 ‘A’ 到 ‘D’,以表示其复杂性。得分在 7 到 8 之间的文本获得 ‘A’,表示可读性高,而得分略低或略高于此范围的文本获得 ‘A-’。该等级从上到下和从下到上递进,‘B+’,‘B’,‘B-’ 分配给逐渐更具挑战性或更具挑战性的文本。得分在 2 到 3 之间或高于 12 的文本,表示可读性最低,获得 ‘C+’ 到 ‘D’ 的等级。

阅读时间

根据单词、句子和音节的计数,估计口头阅读完整文本所需的时间(以分钟为单位)。大约 1-3 分钟的较短时间有助于更容易地理解读者的注意力范围。较长的持续时间表示文本较长、密集。基于每分钟阅读速度为 200-250 个单词。

发言时间

在文本段落中口头表达概念和内容所需的预估时间(以分钟为单位)。较短的时间约为 1-3 分钟,可以减少口头演示时对听众注意力的需求。较长的时间表明文本非常详细和复杂。基于每分钟 125-150 个单词的说话速度。

开始

  • 通过 Obsidian 中的 Community Plugins 选项卡安装插件
  • 通过功能区(一个眼睛图标)打开/关闭插件
  • 在 Obsidian 中打开一个文档进行分析
  • 选择要分析的文本部分
  • 通过设置页面(Community Plugin Settings)访问插件设置

贡献

欢迎问题和拉取请求 - 非常乐意接受任何改进!

支持

如果您遇到任何问题或有功能请求,请在 Obsidian 论坛上联系我们或在此处提出问题。



反馈交流

其他渠道

版权声明