0%

什么是知识图谱

什么是知识图谱?

概念图(concept map)是用图形的方式表征知识,是知识可视化的一种形式,它的根本目的是辅助人类的知识加工,说白了是给人看的,促进知识理解。

知识图谱(knowledge graph)也可以表征为知识网络,但是它主要不是给人看,而是想让机器读懂知识。其背后的前提假设是知识可以通过知识图谱的方式表征出来,其背后隐藏的是符合主义,也就是知识的本质是符合表征。

知识图谱按照应用情境和范围的不同,可以分为通用指示图图谱GKG和领域知识图谱DKG,分别适应于一般性人机交流和特定领域的人机交流。

知识图谱的构成

构成知识图谱的基本单位是三元组。三元组由实体-连接-实体构成,记录了网络中实体与实体的关系,它是本质上就是一条知识连接,一个陈述句,一个命题。命题是可以判断真假的陈述句。命题也是构成知识系统的
基本单位。因此,理论上所以知识都可以表征为命题,继而表征为知识图谱中的三元组。
举一个生物学的例子,比如:

真核细胞-是-细胞
真核细胞-有-细胞核

用这2个三元组就描述了关于真核细胞的2个命题。

三元组的不同形式

理论上,我们可以将任何一个命题表述为三元组,这就需要三元组具有不同的形式,以适应不同的句子。比如:

实体-状态-1:我笑了
实体-关系-实体:我吃饭
实体-关系-实体(状态):我找到了一家高档的餐馆
三元组-关系-实体:我与朋友的关系不是很和睦
实体-关系-三元组:他不同意我与玛丽结婚
三元组-关系-三元组:他对待玛丽就像父亲对待女儿
三元组-三元组-三元组:我肚子饿了和我要去餐馆是事件的前因后果

知识图谱的基本概念

实体(Entity)是对客观个体的抽象,知识图谱中的实体多是具体的。例如:李安,姚明。  
类型(type)是对具有相同特点或属性的实体集合的抽象。例如:国家,运动员。  
关系(relation)是实体与实体之间关系的抽象。例如:导演,父女。  
属性(property)是对实体与实体之间关系的抽象。例如:导演,身高。  
域(domain)是类型的集合,凌驾于类型之上,是对某一领域所有类型的抽象。例如:地理位置,职业。  
值(value)是用来描述实体的,可以分为文本型和数值型。例如:性别:男,身高:226cm。  

知识图谱中的关系类型

隶属:(is-a)
同义:(similar)
从属:(part-of)
相关:(relate-to)
因果:(cause):forward(促进)、restraint(抑制)
从事:(do):发现(discover)、发明(invent)

知识图谱的应用

知识图谱的应用十分广泛,涉及各个行业。比如:

+ 信息检索:搜索引擎中对实体的精准聚合和匹配、对关键词的理解以及对搜索意图的语义分析等;
+ 自然语言理解:知识图谱中的知识作为理解自然语言中实体和关系的背景信息;
+ 问答系统:匹配问答模式和知识图谱中知识子图之间的映射;
+ 推荐系统:将知识图谱作为一种辅助信息集成到推荐系统中以提供更加精准的推荐选项;
+ 电子商务:构建商品知识图谱来精准地匹配用户的购买意愿和商品候选集合;
+ 金融风控:利用实体关系来分析金融活动的风险以提供在风险触发后的补救措施;
+ 公安刑侦:分析实体和实体之间的关系以获得线索等;
+ 司法辅助:法律条文的结构化表示和查询来辅助案件的判决等;
+ 教育医疗:提供可视化的知识表示,用于药物分析、疾病诊断等;
来源:知乎链接:https://www.zhihu.com/question/59281410/answer/579230733
感谢您的鼓励和打赏!