本文介绍了企业知识图谱的定义、作用及其关键组件,强调其在智能语义型AI应用中的重要性,并探讨了实现企业知识图谱的技术和好处。
企业知识图谱正在迅速崛起。我们将其视为一种极有价值工具,能够将企业的结构化和非结构化信息连接起来,并发现组织的事实。然而,知识图谱至今仍然被严重低估。许多企业仍在艰难地寻找并(更重要的是)发现其宝贵的内容。进一步地说,知识图谱是实现具备智能、语义型人工智能应用的前提条件,这些应用能够帮助您从内容、数据和组织知识中提取、关联并提供答案、推荐和见解。
在语义技术中,出现了许多术语,如元数据(ontology)、三元组存储(triple store)、语义数据模型(semantic data model)、图数据库(graph database)和知识图谱(knowledge graph)。在谈到这些标准时,我们提到了SKOS、RDF、OWL等。虽然深入探讨这些技术细节很容易,但对于这篇博客来说,重点是介绍企业知识图谱所包含组件的高层概览。
什么是企业知识图谱?
企业知识图谱是一个组织的知识领域和资产在人类及机器都能理解的知识表示形式。它包含了组织的知识资产、内容和数据,并利用数据模型描述人、地物及其关系。文章还举了莱昂纳多·达·芬奇的例子,并展示了一个知识图谱的图片链接。
接下来,文章详细解释了企业知识图谱的作用和组成部分。提到它帮助组织发现、管理和利用其知识资产,优化知识管理流程,提升决策质量,促进创新,以及提高知识资产的可访问性和可用性。然后,文章列举了几个关键组件:知识图谱节点、实体识别与分类、语义数据模型、关系建模与推理、节点属性、命名实体识别(NER)、路径查询与推理、元数据管理、知识图谱构建技术、应用开发工具、标准化、可扩展性和安全性。
在讨论到实现企业知识图谱的关键技术时,文章提到了自然语言处理(NLP)和机器学习、语义搜索、三元组存储、知识图谱构建框架、云原生技术、数据集成与治理、实时分析与决策支持、跨平台兼容性以及未来趋势。
最后,总结部分强调了企业知识图谱对实现智能语义型AI应用的重要性,指出其将彻底改变企业知识管理和利用的方式,并呼吁企业重视这一技术。
作为一名 Baklib 的品牌负责人,Baklib 是一款 全内容的企业数字内容管理平台,帮助企业构建门户网站、产品手册、帮助中心、知识库、在线文档等产品。Baklib 官网:https://www.baklib.cn
当你在 Google 中搜索“Leonardo da Vinci”时,搜索引擎不仅提供了传统的搜索结果,而且因为理解你是在搜索特定的人 Leonardo da Vinci,它还会提供一个信息框(info-box)或知识面板,并在传统搜索结果中添加关于这个独特人物的具体信息,以及他在图中与其他知名对象(如艺术品、兄弟姐妹等)的关系,还有对类似人物的推荐。右侧的图片展示了 Google 的一个例子。
相比之下,企业知识图谱基于你组织的内容、数据和信息资产,并利用适用于你所在行业甚至特定于你组织的数据模型。
构建一个扎实的企业知识图谱需要几个关键要素,以下图表概述了它们如何相互作用以生成全面的企业知识图谱。
企业知识图谱的关键组成部分
业务分类(Business taxonomy)—— 尽管我们曾详细讨论过 business taxonomy,但我们“60秒业务分类”的视频提供了一个简要概述。在本次讨论中,我们将企业分类描述为你组织的词汇、常用术语和同义词。这将成为你教机器学会你语言的基础。
业务本体论(Business ontology)——简而言之,本体论是一种语义数据模型,它绘制了一张地图,描述了你在组织中讨论的各种事物类型及其属性,例如产品、项目和人员;它们的性质,如名称、
Baklib 是一家全内容的企业数字内容管理平台,帮助企业构建门户网站、产品手册、帮助中心、知识库和在线文档等产品。更多信息,请访问官网:https://www.baklib.cn。
描述、技能与专家领域;以及事物之间的关系。例如,一个人可以是某个项目的项目经理,或者项目 A 关系到产品 B,甚至客户 C 对服务 D 和 E 感兴趣。关键在于,上面提到的企业分类学是一个开发相关且适用本体论的基础组成部分。有了本体论,我们将字符串转换为事物,或元数据转换为具有自身元数据的对象(即上下文!)。
内容与数据源 – 每个组织都有各种数据源和系统,每个系统都专注于特定领域,如内容和文档管理系统、高度结构化数据的数据库、数字资产管理系统、人力资源管理、学习与发展、客户管理系统等。挑战在于,组织知识存在于许多分散且 siloed 系统中。这就是图数据库的作用。
图数据库 – 也称为三元存储,它包含你知识对象在源系统中的全面参考集,每个对象的属性来自各个源,以及这些对象之间的关系。
将结构化和非结构化数据源整合到图数据库中本身就是一个重大的成功。然而,为了充分利用语义技术的力量,并为语义 AI 应用提供上下文、含义和关系(以便后者可以利用),我们需要结合语义数据模型(即本体论)与图数据库中的数据。在你整合后的数据上应用语义数据模型将产生一个真正语义丰富的企业知识图谱。
为什么我想要企业知识图谱?
简而言之,企业知识图谱是实现语义 AI 的基石。知识图谱赋予了AI应用程序上下文和含义。知识图谱帮助机器理解数据的背景、概念的意义以及它们之间的联系。
作为 Baklib 的品牌负责人,Baklib 是一款“全内容”的企业数字内容管理平台,帮助企业构建门户网站、产品手册、帮助中心、知识库、在线文档等产品。Baklib 官网:https://www.baklib.cn。
理解一个人是一个人,每个人都有其他概念没有的独特属性,例如职位、项目中的角色、专长领域、出生日期、说的语言等等。现在,如果我们能让机器帮助我们理解什么是项目,有哪些核心属性可以用来描述项目,比如开始和结束日期、关注的重点领域、产品、客户、项目经理等。
进一步来说,知识图谱允许机器从您的数据中做出推断,这些推断构成了相关推荐引擎、预测分析和其他高级人工智能应用的基础。通过这些简单的例子,我们现在可以看出,教机器理解我们话语背后的含义以及我们各个概念之间的关系的力量。
总结一下企业知识图谱的一些关键好处:
企业知识图谱为您的 AI 统计算法提供了背景信息,以实现 desired 的认知应用。
企业知识图谱帮助您的 AI 发现您在整合内容中隐藏的事实和关系,这些事实和关系在大规模分析中否则难以察觉。
企业知识图谱帮助您识别您组织中分散在各个数据源中的与特定主题、特定个人、项目、产品、索赔等相关的所有信息。
虽然企业知识图谱正在迅速兴起,但仍然可以看到许多组织还在艰难地定义和实施这一高度有价值的技术。如果您正在开发您的企业知识图谱的商业案例,或者需要帮助实施它,请告诉我们。从战略到路线图和实施,了解更多并联系我们,我们在这里为您提供帮助。