|
今天面试了华为,遇到了一个问题。如何进行知识图谱中schema的定义。大家知道的我读书少,喜欢按照自己的方式进行应用的探索。这里我们以军事知识图谱进行举例。如何定义军事知识图谱中的节点、属性与关系。

图片来源于互联网
本文主要围绕架构中的军事知识图谱与军事事件图谱展开。
(一) 军事知识图谱
第一步确定本体及本体属性
按照动力来源方式分为冷兵器与热兵器,我们今天围绕热兵器展开军事知识图谱的构建。
军事知识图谱中的本体围绕枪械、弹药、坦克、大炮、步兵炮、舰载炮、地雷、战舰展开。其中枪械按照使用场景分为手枪、步枪、冲锋枪、霰弹枪、电击枪。坦克按战斗全重和火炮口径分为轻型、中型、重型坦克。轻型坦克重10-20吨,火炮口径不大于85毫米;中型坦克重20-40吨,火炮口径不大于105毫米;重型坦克重40-60吨,火炮口径最大为122毫米。按用途分有主战坦克、侦察坦克、空降坦克、水陆坦克,扫雷坦克等等。
本体 | 关系数量 | 421 纳莱颂恩(Naresuan)号 | 7 | 歼-10战斗机 | 6 | 新舟600 | 6 | “博拉格”(boragh)装甲输送车 | 6 | 本体共有的属性包括:产地、
时间类属性:
包括武器发明时间、武器使用战役、战役发生时间、战役结束时间。武器配置部队-开始服役时间、结束服役时间。武器生产批次、武器生产批次出厂时间。
对武器的动态关系基于全网社交媒体爬虫。构建武器评论、涉及武器。
枪械特有属性
弹药特有属性
坦克特有属性:
内燃机属性:柴油发动机、汽油发动机、电机发动机。
空载重量、火炮口径、用途
弹药特有属性:弹药性能、弹药类型
第二部确定本体与本体之间的关系
枪械与弹药的关系
坦克与弹药的关系
第三部确定本体别名
围绕着我们的本体进行内容的扩充,可以达到更好的知识原始信息的效果。主要的爬虫来源为baidu、google、bing等搜索平台。构建大量的非结构化数据。标注原始数据来源于军事知识图谱数据集构建非结构化文本映射三元组。
在我们确定好知识图谱架构后,
(二)军事事件图谱
(三)军事知识图谱应用
(四)军事事件图谱应用
常见的事件图谱具有一下应用,事件因果关系、事件。按照非结构化数据来源,我们可以分为军事百科知识图谱、军事学术知识图谱、军事舆情事件图谱、军事引用关系图谱。
军事百科知识图谱围绕军事名词的百科进行知识图谱的构建。
军事学术知识图谱面相军事相关论文、专利、软著展开构建。理解构建的核心壁垒,寻找共性。寻找实体属性之间的差异点。到这里我们可以清楚的了解到知识图谱实体与实体之间的是关系、实体与实体特异性之间的是属性。
不管我们用neo4j、tigerGraph、nebula做图数据库也好或者是什么其他的,核心我们要做的是分别从结构化数据中和非结构化数据中构建节点、关系、属性。在我们构建好知识图谱后、我们可以用ml、transe、graphLearning等算法来利用我们的算法去进行更深度的知识图谱的应用。
承接各类知识图谱设计 微信 Q2405547549 希望大家照顾照顾我的生意。 |
|