知识图谱(什么叫知识图谱)
一、知识图谱有什么用处或者优点
随着计算机计算能力的提升、大数据的爆发以及各种新型算法的提出,人工智能在历经几番沉浮之后,再一次焕发出了新的生机,尤其是以深度学习为代表的机器学习相关领域。但是,随着深度学习、各种神经网络对大数据的红利消耗殆尽,如果我们不进一步在基础理论上获得新的突破,那么以深度学习为主的机器学习模型其效果的天花板将日益迫近。
在2012年谷歌提出知识图谱并将其用于语义搜索中之后,知识图谱再一次涌入学者的研究视线,将这些蕴含着人类大量先验知识的知识图谱与深度学习融合成为了进一步提升人工智能效果重要思路之一,知识图谱的地位也再一次得到了重视。
那么知识图谱到底可以应用于哪些领域呢?
1)知识图谱辅助搜索
知识图谱的引入使得传统的基于网页的搜索方式得到的补充,让搜索直指答案本身,也就是说从传统的链接文本转为链接数据,即WebofTexts,WebofDocuments到WebofData,WebofObjects的转变,这种方式能让我们将复杂的不便与计算机分析处理的文本数据转换为基于实体的、对象的数据,使得计算机能更好地建立实体之间的链接关系。
2)知识图谱辅助问答
问答系统是搜索系统的进阶交互形式,为了能让对话系统更加准确和可靠的给出想要的信息,那背后一定要依托一个巨大的知识图谱。比如我们熟悉的苹果手机的智能语音助手Siri就依托于以WolframAlpha公司为提供的知识搜索技术。
此外,通过构建各个领域,例如,金融、医药、电商、企业等的知识图谱,可以帮助金融从业者、医患人员、买家卖家等对特定问题进行辅助决策。利用知识图谱与深度学习进行一些常识的推理等工作也是目前众多学者正在研究和攻克的方向。
二、如何实现大规模知识图谱的构建、推理及应用
一KonwledgeGraph概念
KonwledgeGraph是谷歌于2012年提出的用于增强其搜索引擎功能的知识库。本质上来说,知识图谱是一种揭示实体之间关系的语义网络,可以对现实世界的事物及其相互关系进行形式化地描述。现在的知识图谱已被用来泛指各种大规模的知识库。
具体表现:在谷歌中搜索北京景点,能够得到结构化的知识,而不是简单的网页结果。
知识图谱是一种结构化的语义知识库,其基本组成单位是“实体-关系-实体”的三元组,以及实体及其相关属性-值对,通过实体间的关系构成网状的知识结构,如:
上图构成一个特定领域(明星)的知识网络,每一个节点(如:谢霆锋)均为实体,实体具有属性-值(key-value)对(如:明星名字:谢霆锋),同时实体与实体之间通过关系(如:王菲-旧爱-谢霆锋)相互连接。
也就是说:
实体-对应现实世界的语义本体;
属性-描述一类实体的common特性,实体被属性所标注;
关系-对应本体间的关系,连接了不同类型的实体。
二KonwledgeGraph架构
从逻辑架构上分,可将KonwledgeGraph分为两层:数据层与模式层。
数据层主要由一系列的事实组成,而知识将以事实为单位进行存储,如:实体-关系-实体,实体-属性-值这样的三元组,对应到实际的数据;模式层则建立在数据层之上,主要是通过本体库来规范数据层的一系列事实表达,对应到实际的数据规范,术语描述等。
从体系架构上分,可将KonwledgeGraph分为两种模式,自顶向下与自底向上。
1)自顶向下
自顶向下,首先定义好本体,确定领域的层次结构及各个概念属性及概念与概念间的关系,之后再将实体加入到知识库中,类似一种填充的模式,代表工作是Freebase,从维基百科中提取结构化数据。
2)自底向上
自底向上指的是从开放的数据源中,抽取实体、属性及关系,往上构建概念,最终形成本体。目前,这个模式被大多数工作采用,代表工作有谷歌的KnowledgeVault。
下面是一般自底向上构建本体库的流程:
三KonwledgeGraph应用
1)优化搜索
对比谷歌和百度对“黄山多大”的搜索结果,可以看到对同名实体进行属性搜索,百度和google给出了不一样的排序结果。
2)金融领域的智能投顾、反欺诈等
3)社交领域中的兴趣推荐、用户聚类等
三、科学知识图谱方法与工具入门
《科学知识图谱:方法与应用》是大连理工大学WISE实验室用科学计量学及其最新的知识图谱与可视化方法,形象化展示科学知识的发展进程与结构关系的一部学术专著。系统阐述了科学知识图谱的原理与方法及其在科学学与管理学前沿、工程技术前沿、科学技术合作等领域中的应用成果。该书图文并茂,彰显了色彩缤纷的科学知识网络世界,昭示科学知识图谱是跟踪科技前沿、选择科研方向、开展知识管理与辅助科技决策的一种有效工具。