知识组织
知识的定义
从整个知识组织的演变历史的视角看,知识的定义其实发生过三次变化。
第一阶段:文献即知识
书籍是通往知识的钥匙.
其实在过去很长一段时间中,书籍往往是和知识划等号的。在过去的年代里,书籍与文献的数量相对有限,凭借着对书籍和文献的有序管理,人们可以较为轻松地找到自己所需的知识。因此,在过去的年代,管理书籍就是管理知识。
但是,随着书籍文献的井喷式增长,人们逐渐发现这种做法逐渐开始不管用了。
我们都知道,无论是一本书还是一篇文献,其往往不会只写一个主题。比如,一篇讲述白切鸡做法的文章,它可能主要讨论白切鸡怎么做,但也可能讨论了哪些鸡是做白切鸡的好鸡。而在文献组织的过程中,很多时候我们只会给“白切鸡怎么做”这个主要主题赋予检索标识,而忽略了“哪些鸡是做白切鸡的好原料”这个细小的主题。这就使得我们后期难以对这个细小主题进行查找。
那该怎么解决这个问题呢?实际上这个问题的根源是我们在进行组织时,把“知识”定义得过大了——一篇文献包含了太多太多的知识。为了将管理单元缩小一些,人们发明了一种名为文摘的东西,开始把文摘定义为知识。
第二阶段:文摘即知识
什么叫文摘呢?或许,你对文摘的第一直觉就是“从文章中摘抄下来的东西”,但其实这个感觉已经八九不离十了。所谓文摘,就是以提供文献内容梗概为目的,不加评论和补充解释、简明、确切地记述文献重要内容的短文 1。从文摘的用途上来说,文摘可以分成报道性文摘、指示性文摘和选择性文摘三种 2。
- 报道性文摘:正如其名,报道性文摘的作用就是对原文进行报道,向读者介绍原始文献的主要内容、观点、论据、论证方式与结论等等,从而让读者读了文摘后可不用再次回看原文,以节省阅读时间。
- 指示性文摘:指示性文摘则侧重“指示”的作用,其更像是一种简介,向读者展示原文的讨论对象、讨论角度、方法与结论等信息,而不会像报道性文摘那样将这些信息详尽报道。因此,如果读者需要进一步了解原文的内容,则需要去阅读原文,文摘只能帮助读者判断原文是否值得阅读。
- 选择性文摘:选择性文摘则侧重“选择”的作用。正如前文所说,一本书可能会包含不同的主题,而不同学科背景、不同目的的读者需要从书中获取的信息和知识往往是不同的,选择性文摘就是将不同主题的内容分别摘录出来,以供不同需要的读者查阅。
有了文摘,特别是指示性文摘后,我们就能轻松地将书籍与文献中不同主题的内容抽离出来,实现对知识和信息的更细粒度的管理了。实际上,现在我们很多时候做的笔记,本质上就是在做指示性文摘,将书籍、文献、视频等各种信息源中对自己有用的信息抽离出来,以供日后使用。
但是,文摘仍有其自身的问题,其最大的问题在于信息的记录是冗余的。举个例子,张三可能写了一篇如何制作白切鸡的文章,我们可以为这篇文章编写一篇文摘 A;过了一个月,李四也写了一篇如何制作白切鸡的文章,我们也可以为这篇文章编写一篇文摘 B。后面,当我们想查找如何制作白切鸡的相关信息时,我们就会同时检索到文摘 A 和文摘 B——尽管两篇文摘的内容可能没有多大差别,但其仍然作为两个独立的检索结果返回了。这种情况对于文摘本身来说并不是问题,毕竟文摘就是为压缩文献内容而生的,两个作者写的两篇文章,哪怕其内容相似,但也是两篇文献,理应有两篇文摘。但是,当我们出于知识组织的目的来看,两篇文章写的内容(知识)是相似的,其就应该只返回一个结果。
怎么解决这个问题呢?这就是当下知识组织领域的研究内容了。
知识单元即知识
为了解决上面的问题,我们就必须精确的定义什么叫知识,更学术一点来说,就是定义什么叫知识元。所谓知识单元,又可以称为知识元,是文献中相对独立的、最小的、不可分割的、表征知识点的一个元素,它可以是一段文字、一幅图表、一个公式、一章或一节、一段动画、一个程序等 3。乍一听,这个概念与当下笔记圈子里强调的“一篇笔记只记录一个想法”异曲同工。其实在这点学术界和笔记圈子的愿景是相同的,就是希望通过基于知识单元作为基本管理单元,从而避免信息的冗余记录,实现知识的融合以及知识的高效检索。
但可惜的是,愿景目前仍然是愿景。对于知识单元,目前学界仍然无法为其下一个准确地描述性定义,其粒度和形态仍然是不明确的 4。这就使得基于知识单元的标准化知识组织难以开展。这里可能有读者会问,不是已经将知识单元定义为不可分割的最小知识元素了吗,为什么还说其没有一个准确的定义呢?其实仔细一想就能明白,这个定义只是告诉了我们理想状态下知识单元应该是怎样的,但并没有告诉我们在一篇篇具体的文献中,哪些内容是知识单元,哪些内容不是知识单元。
目前来说,关于知识单元的定义问题,学界已经衍生出一个名为“知识表示”的研究领域,专门来研究知识的定义和表示方法。目前,研究中常见的知识表示方法有以下几种:
- 谓词逻辑:谓词逻辑是一种建立在逻辑学的形势逻辑基础上的知识表示方法,其利用逻辑公式来描述对象、性质、关系等知识。比如,“小明出生于中国”可以表示为“birthplace (小明,中国)”,“小明出生于美国”可以表示为“birthplace (小明,美国)”。那么,“小明出生于中国或美国”则可以表示为“birthplace (小明,中国) OR birthplace (小明,美国)”。
- 产生式规则:产生式规则是一种简单而直观的规则表示方法,简单来说就是逻辑链,其由多个“IF… THEN…”语句连接而成,表示“如果… 就…”。比如“如果你体温大于 37.5 摄氏度,那么你发烧了”可以表示成“IF 你体温>37.5 摄氏度,THEN 你发烧了”。另外,当有多个这样的句子时,计算机就可以实现推理功能。比如“IF 你体温>37.5 摄氏度,THEN 你发烧了”,“IF 你发烧了, THEN 需要吃布洛芬”,这样两个句子就构成了一个“体温高 ->发烧 ->吃药”的逻辑链,从而实现了机器推理。
- 框架表示:框架表示是一种结构化的知识表示方法,这种方法认为某个领域中的知识可以用一种框架来表示。比如,对于哲学家这个类下的具体知识,其都会具有“性别”、“出生日”、“主要作品”、“主要思想”等共同的属性。
- 语义网络(三元组):语义网络是一种图形化的知识表示方法,它将概念和实体之间的关系表示为图形和节点之间的连接。例如,“猫抓老鼠”这个知识,我们可以将猫和老鼠表示为两个节点,并使用一条边将它们连接起来表示它们之间抓与被抓的关系。
从以上叙述不难看出,目前的知识表示方法更多是侧重于计算机理解的知识单元,其粒度多为句子级别(甚至更小),与我们人类想做的知识组织还是有所区别的。
到底我们应该怎么去完成知识单元级别的知识组织呢?目前很难有一个定论,只能是去实践各种不同的方法后来找到最符合自己情况的方法。下一节,我们就进入到最后一部分,来看看各种各样的笔记组织方法。
什么是知识组织
知识组织一词最早出现于 20 世纪 20 年代末,由英国著名分类法专家 H. E. Bliss 提出 5。从狭义上来说,知识组织指的是在图书馆、档案馆等机构中由图书管理员、档案管理员等人员进行的文档描述、索引和分类等活动 6。而从广义上来说,知识组织是对人类知识(无论是文献这种显性知识,还是人类经验这种隐性知识)进行的搜集、整理、加工、整序、控制等活动 7。
在知识组织的方法上,不同学者给出了不同的划分。比如,李桂贞认为知识组织的方法可以分成以文献单元为基础的方法、以数据单元(知识单元)为基础的方法,以及以专家智能系统为基础的组织方法 8。而曹思源认为,知识组织方法可以分成以基础知识架构为基础、以分类体系构建为基础和以关系网络建立为基础的三种类别 9。常娥则认为知识组织方法主要分为元数据、知识本体、知识地图和语义网络四种类型 10。考虑到以上学者的划分,并综合组织方法以及所组织单元的粒度,本文将个人知识组织的方式分成以下三种:
- 以文献为单元的知识组织
- 以摘要为单元的知识组织
- 以知识为单元的知识组织
知识组织的基本流程
看到这里,有的读者可能就会好奇,该怎么对知识进行组织呢?这个问题其实非常宏大,因为这里既涉及管理单元是什么,又涉及组织方法是什么。但这里我们可以先放下对管理单元的讨论,先了解一下知识组织的基本流程,从而在宏观上对知识组织有一个大致的了解。
其实知识组织的流程和日常我们整理东西的逻辑是非常相似的。我们可以想想看平时我们是怎么整理衣柜的。
首先,把散落的衣物汇总起来。然后进行分门别类——外套用衣架挂好,放入衣柜专门的外套格;裤子叠好,放入裤子格;内衣裤放入内衣裤格;袜子放入袜子格……这样,我们找衣物时,我们就可以先按衣物的种类打开对应的收纳格,再找到我们想要的那件衣物。
在这个过程中,每个收纳格实际上就代表着一类衣物。检索时我们可以通过这个类别符号作为中转,通过“先定位类别,再在类别中寻找特定衣物”的逻辑,轻松地找到任何所需的衣物。
知识组织也是如此。实际上图书馆学家们在过去的几百年中,创建了各种各样的检索符号,让我们可以将知识分门别类。而在检索时,我们就能通过这些检索符号,快速地定位到所需的知识类别,再在那个类别中找到我们所需的知识。
文献组织方法
由于大多数可供利用的信息依附于特定的载体,而这些载体就是所谓的文献,所以研究上常把文献与信息混用,把文献组织、文献信息组织统称为信息组织 11。信息组织是图书馆学的重要研究内容,其主要目的是将零散、无序的信息(文献)予以系统化、有序化的过程 12。
信息组织有两种基本方式:一种是以文献的内容为依据对文献进行组织,另一种是以文献的外表属性为依据进行组织 11。
基于文献外表属性的组织方法
所谓文献的外表属性,指的是文献的题目名称、作者名称、载体形式等外在的属性。依外表属性进行文献组织,就是指依据文献的题名、作者、载体形式等显著属性来对文献进行有序化 11。比如图书馆中将图书与报刊杂志分开管理,我们平时按文件撰写日期、作者来对其进行分组、排序都是典型的按文献外表属性进行组织的例子。
在一些情况下,按这些外表属性进行文献组织是很有用的。比如,我们想找 2019 年 4 月份的项目文件的时候,这种按文件编写时间进行分类组织的方法就非常有效了。
但大多数时候,我们在查找文献时,往往都是从文献的内容入手,希望找到特定内容的文献。比如,我们在写毕业论文的时候,肯定是按照自己论文所研究的内容来搜索文献,而不是说“我要找 xx 年 xx 月发表的文献”。因此,很多情况下,仅凭基于文献外表属性的组织方法难以满足我们的需求。这就需要依据文献内容进行组织的方法。
基于文献内容的组织方法
人们提到信息组织,更多的是指针对文献内容的组织方法 5。基于文献内容的组织方法,主要有以下几种:
- 分类法:分类法是最传统的组织方法 13
- 主题法:与分类法互补的方法,主要有 主题法#标题法, 主题法#元词法,主题法#叙词法,主题法#关键词法。
- 引文网络:这种方法指的是通过文献的参考文献构筑引文网络、然后再使用文献计量学相关方法对其进行分析的方法
基于分类法主题法的个人知识管理系统
了解了以上信息组织方法后,我们就可以实现第一种个人知识管理系统了。
第一种个人知识管理系统由原文库和笔记库两部分组成。理由很简单,因为笔记是我们对文献、图像、音频中知识的概括,因此可能会出现记录不周、日后遗忘的情况,这时候我们就需要辅以一个原文库,在记笔记的时候附上知识的出处,这样我们日后查找复习就方便多了。现在我将分别讲解每个库的搭建方法。
Footnotes
-
国家标准局. (1986). 文摘编写规则. 国家标准局. ↩
-
桑良至. (1993). 文摘学概论. 北京:中国书籍出版社. ↩
-
文庭孝. (2007). 知识单元的演变及其评价研究. 图书情报工作, 10 vo No.359, 72–76. ↩
-
索传军 & 盖双双. (2018). 知识元的内涵、结构与描述模型研究. In 中国图书馆学报 (CNKI; Vol. 44, Issue 04, pp. 54–72). ↩
-
Bliss H E,Dewey,John. The Organisation of Knowledge and the System of the Sciences [M]. New York: Henry Holt and Company,1929:356-357. ↩ ↩2
-
Hjorland, B. (2008). What is Knowledge Organization (KO)? Knowledge Organization, 35(2–3), 86–101. ↩
-
胡兆芹. (2014). 本体与知识组织. 中国文史出版社. ↩
-
李桂贞, & 郑建明. (2006). 知识组织的方式方法研究综述. 新世纪图书馆, 02, 7–10. ↩
-
曹思源, & 马海云. (2021). 领域知识组织理论基础及方法分类简述. 情报资料工作, 42(05), 14–22. ↩
-
常娥, & 夏婧. (2016). 多种知识组织方法比较. 图书馆论坛, 36(08), 1–6. ↩
-
周宁, & 吴佳鑫. (2010). 信息组织 (3rd ed.). 武汉大学出版社. ↩
-
Hjorland, B. (2008). What is Knowledge Organization (KO)? Knowledge Organization, 35(2–3), 86–101. ↩
讨论
若阁下有独到的见解或新颖的想法,诚邀您在文章下方留言,与大家共同探讨。
反馈交流
其他渠道
版权声明
版权声明:所有 PKMer 文章如果需要转载,请附上原文出处链接。