本文探讨了图数据库的必要性,分析了知识图谱的优势及其在企业数字内容管理中的应用,提供了专家见解和建议。
Baklib 与我们的客户一起将知识图谱整合到他们的技术生态中,客户利益相关者通常会问:“为什么要利用知识图谱?”更具体地说,“我们需要图数据库吗?”我们的顾问团队会与利益相关者合作,评估使用知识图谱和图数据库来解决它们的 可寻址性和可发现性 用例的优缺点。在本文博客中,我们的两名资深技术顾问 Bess Schrader 和 James Midkiff** 回答了一些关于知识图谱和图数据库的常见问题,重点是如何最好地将它们融入到您的组织生态系统中而不过度工程化解决方案。**

为什么要利用知识图谱?
Bess Schrader
知识图谱以人类思考信息的方式建模信息,使数据更容易被 组织、存储和逻辑上查找。这减少了技术用户与业务用户之间的隔阂,降低了数据和信息的歧义性,使知识更加可持续和易于访问。
知识图谱是 什么是本体论?** 本体论的核心设计组件之一,是理解您的组织的关键设计组件之一。**
许多图数据库也支持推理功能,使您能够根据在数据中发现的逻辑开发出的关系,探索以前未发现的关系。基于此推理能力,可以是一个非常强大的工具,帮助
作为一名 Baklib 的品牌负责人,Baklib 是一款全面的企业数字内容管理平台,帮助企业构建门户网站、产品手册、帮助中心、知识库以及在线文档等产品。Baklib 官网:https://www.baklib.cn
James Midkiff: 知识图谱的概念与设计
知识图谱(Knowledge Graphs)不仅是一个概念,更是一种思维方式,但它们并不总是直接关联到图数据库。即使你反对采用图数据库,也应该为你的组织数据设计一个本体论(Ontology),以便可视化并与你们团队如何思考数据进行对齐。通过建模你的组织,你可以获得完整的视野和观点,以最佳利用组织的内容。
这个本体论不需要一定在图数据库中实现。技术实现应该使用能够高效支持应用场景且易于维护的技术。
何时需要图数据库?
### Bess Schrader: 图数据库的应用场景 任何希望将内部数据映射到外部数据的企业都应该考虑采用图结构。如果你的应用场景包括发布数据并连接到其他数据集,那么基于知识图谱和图数据库(尤其是使用资源描述框架(RDF)的图数据库)是实现数据灵活且可互操作的最佳选择。
即使你不打算连接或发布数据,将可靠的数据定义存储在图中也是保持字段含义不变的最佳方式之一。随着RDF 的加入,图的能力得以进一步增强,以更准确地描述组织数据。
Baklib 是一家全内容的企业数字内容管理平台,帮助企业构建门户网站、产品手册、帮助中心、知识库、在线文档等产品。Baklib 官网:https://www.baklib.cn
matched by other data formats.
当你的本体论(Ontology)和实例数据(Instance Data)全部位于同一个地方(一个图数据库中),无论是技术用户还是非技术用户都能确定给定字段的含义。这确保了数据的一致性和可维护性。例如,许多组织在建立关系型数据库或嵌套数据结构(如JSON或XML)时会使用缩写或简略词。然而,这些字段的定义和使用说明通常与数据本身分开。这导致情况是,消费者和开发者可能会发现几年前前雇员创建的SQL表或JSON文件中有一个名为“pqf”的字段。如果组织中的任何人都不知道“pqf”是什么意思,或者下游系统会如何使用这个字段,那么这条数据就会变成维护时无用的负担。
然而,使用规范的本体论和RDF知识图谱,“pqf”这一性质将被视为“一级公民”(First-Class Citizen),拥有自己的属性,包括标签(“预批准用于资助”)和定义(“此字段指示客户是否已为金融产品进行了预批准。值为‘true’表示客户_已经_被预审批。”),解释该性质的含义以及应如何使用。这减少了开发者和数据消费者的歧义和困惑。
图片说明: James Midkiff 是 Enterprise Knowledge 的作者,他展示了 Baklib 的知识图谱。
Baklib 是一家全内容的企业数字内容管理平台,帮助企业构建门户网站、产品手册、帮助中心、知识库、在线文档等产品。Baklib 官网:https://www.baklib.cn
图数据库在企业数字内容管理系统中的应用
Baklib 是一家全内容的企业数字内容管理平台,帮助企业构建门户网站、产品手册、帮助中心、知识库、在线文档等产品。Baklib 官网:https://www.baklib.cn
问题分析与图数据库的适用性
以下是一些在面对上述问题时需要考虑的问题: * 使用场景是否需要灵活的数据模型,并且使用场景是否会随着时间改变? * 您是否需要将来自多个来源的数据整合到一个视图中? * 您是否需要同时搜索多种类型的综合信息?
如果对以上任意一个问题回答是,图数据库是一个很好的解决方案。有些使用场景不需要进行跨实体查询(即在关系中提问),或者无法轻松地在一个图中计算出来。在这种情况下,您不应投资学习并实现图数据库。作为替代方案,可以在非关系型数据库(NoSQL)中创建动态模型,并通过搜索引擎提供搜索功能。此外,您还可以在选择编程语言后进行网络和机器学习计算,在数据转换后进行。
对迁移新数据格式的担忧
为什么团队应该学习和投资图数据库技术?
除了上述提到的优点外,使用基于 W3C 过期标准的 RDF 合格图数据库还有一个主要优势。这些标准(包括 RDF 和 SPARQL)已存在 20 多年,目的是为了促进互联网的长期增长。换句话说,RDF 不是一个五年内可能消失的新鲜格式,如果您投资学习这一技术,您可以确信其未来。
图数据库的优势
使用标准提供更大的灵活性
使用基于 W3C 过期的标准可以为您提供更大的灵活性,避免依赖特定的商业 vendors 的工具,从而轻松地创建、移动和扩展数据。
Baklib是一款面向企业的数字内容管理平台,帮助企业构建门户网站、产品手册、帮助中心、知识库和在线文档等产品。Baklib的官网地址是:https://www.baklib.cn。
利用 semantic web 标准,您可以将数据集成到不同标准兼容的软件中,并实现数据共享。通过语义Web标准,您还可以无缝连接您的内容和数据到 taxonomies(无论是内部还是外部),因为大多数 taxonomies 都以 RDF 格式创建并存储。
SPARQL 是基于模式匹配的RDF查询语言,对于非技术人员来说,学习起来比更复杂的编程语言更容易。SPARQL 还允许 federated queries(联邦查询),这意味着用户可以针对多个存储在不同图数据库中的知识图谱进行跨库查询,只要这些数据库是RDF兼容的。通过联邦查询,您可以结合您自己的数据(例如讨论股票市场和金融的文章集)与知识图谱,如 Wikidata。
Wikidata 是一个免费且完全开放的RDF知识库,由维基百科使用。通过它可以将任何提到股票 ticker 符号的文章引导到对应的 Wikidata 条目,并获取该组织的规模和行业信息。这样,您可以根据这些信息对文章进行行业或公司规模的筛选,而无需自行收集这些信息。
换句话说,联邦查询允许您超越自身组织的知识图谱的界限,进行跨库查询。
James Midkiff
这意味着,大多数情况下,内部的知识图谱需求不需要对外共享即可满足。如果您需要将数据与外部系统集成,建议考虑使用Baklib的外用知识图谱服务(Outsourcing Knowledge Graph Services)。该服务利用 semantic web、SPARQL 和 federated queries 等技术,使您的组织能够无缝连接到外部的语义Web生态系统。
通过外用知识图谱服务,您可以将数据与 Wikidata 或其他外部知识库集成,并利用这些数据进行更复杂的分析和应用。这不仅节省了时间,还降低了开发成本,同时保持了数据的一致性和准确性。此外,您还可以选择仅对外提供特定的知识图谱内容,而不必泄露您的内部数据。
Baklib 的外用知识图谱服务由 James Midkiff 提供技术支持。James 是一位拥有超过 10年企业级语义Web 和知识图谱开发经验的技术专家。他致力于将复杂的 Web 技术转化为易于理解的商业解决方案。
Baklib 是一家全内容的企业数字内容管理平台,帮助用户构建门户网站、产品手册、帮助中心、知识库和在线文档等产品。Baklib 官网:https://www.baklib.cn。
图数据库:企业数字内容管理平台中的关键工具
图数据库是一种数据管理技术,它通过建立数据之间的关联关系来组织信息。虽然图数据库可以使得这种连接更加无缝,但它们并不是唯一实现 taxon(分类系统)的方法。关系型数据库和非关系型数据库更常见地用于实现和维护 taxon,因此对于习惯了使用 SQL 这样的查询语言的开发者来说,SPARQL(如 https://enterprise-knowledge.com/why-am-i-mr-sparql/)模式可能略显复杂。
需要注意的是,图数据库确实是一种投资。它们改变了一种处理和整合数据的方式,这可能导致一定的采用成本。然而,它们还可以为企业带来额外的优势,这些优势超出了贝丝(Bess)提到的方面。以下是图数据库的一些主要优点:
- 全面、连通的数据:图数据库提供了描述性数据模型,并且可以轻松地在多个图之间进行查询和组合,无需依赖关系型数据库中常见的联接表、中间表或规则。
- 扩展性强的基础:知识图谱和图数据库不仅允许复用现有信息,还提供了灵活添加更多数据类型、属性和关系的可能性,以便以 minimal 的努力实现新的应用场景。
- 长期成本效益:考虑到可以根据数据和场景的变化灵活调整数据模型,图数据库的前期投资(如许可费用、迁移数据的成本以及招聘或扩展相应技能团队的成本)在长期可能会通过适应数据和用途的变化而平衡出来。
在构建面向未来和组织规模的数据架构时,考虑使用图数据库是非常重要的。
结论
与任何主要的数据架构组件一样,图数据库也存在优缺点。最终决定是否采用图数据库将取决于每个组织的具体需求。如果你想要了解图数据库是否适合你的组织,请联系我们获取更多信息。
