介绍一种领域知识库的构建方法和装置与流程

如下介绍的介绍一种领域知识库的构建方法和装置与流程,小编为大家介绍文章内容


本发明实施例涉及数据处理技术,尤指一种领域知识库的构建方法和装置。



背景技术:

(一)本体技术

关于本体的研究非常广泛,最为常用的分类方法是根据本体应用主题,将这些为数众多的本体划分为五种类型:领域本体、通用或常识本体、知识本体、语言学本体和任务本体。而依据本体的层次和领域依赖度,guarino等人将其分为四类:顶层本体、领域本体、任务本体和应用本体。

1、顶层本体:研究通用的概念以及概念之间的关系,如空间、时间、事件、行为等,与具体的应用无关,完全独立于限定的领域,因此可以在较大范围内进行共享。

2、领域本体:研究的是特定领域内概念及概念之间的关系。

3、任务本体:定义一些通用任务或者相关的推理活动,用来表达具体任务内的概念及概念之间关系。

4、应用本体:用来描述一些特定的应用,既可以引用领域本体中特定的概念,又可以引用任务本体中出现的概念。

(二)领域知识库

在进行文本的主题分析和文本的内容分析的研究中,"领域知识"是不可或缺的基础知识,而"领域知识库"是系统的管理"领域知识"的有效途径,构建领域知识库的研究工作具有极其深远的意义。

(三)知识推理

涉及面向知识图谱的知识推理,完成对数据的深度分析和推理。本质上,面向知识图谱的知识推理是指根据知识图谱中已有的知识,采用某些方法,推理出新的知识或识别知识图谱中错误的知识。相应地,它包括两方面的内容:知识图谱补全(knowledgegraphcompletion,knowledgebasecompletion)和知识图谱去噪(knowledgegraphrefinement,knowledgegraphcleaning)。知识图谱补全又包括连接预测(linkprediction)、实体预测(entityprediction)、关系预测(relationprediction)、属性预测(attributeprediction)等任务。

目前,工业界仍然缺乏对面向知识图谱的知识推理研究进行系统、深入地梳理与总结的工作。主要存在的问题有:

1、图谱的数据治理成本高;

2、专家系统推理能力没有通用性;

3、事理图谱没有在工业领域的落地方案;

4、特定领域知识库建构完全依赖专家经验。



技术实现要素:

本发明实施例提供了一种领域知识库的构建方法和装置,能够建立一个低成本的、基于知识推理的知识库,实现自动化决策过程,提升图谱的数据质量和灵活性,减少数据治理难度和成本。

为了达到本发明实施例目的,本发明实施例提供了一种领域知识库的构建方法,所述方法可以包括:

根据预设的专家知识库获取实体数据,所述实体数据可以包括:实体的概念和属性以及实体之间的关系;

利用预设的抽取技术对所述实体数据进行文本信息抽取,将抽取的文本信息作为本体数据;

采用创建好的推理知识库对所述本体数据进行知识构建根据知识构建获取的新知识形成新的领域知识库。

在本申请的示例性实施例中,所述知识构建可以包括:使所述本体数据之间进行相互印证和相互校验,并指出所述本体数据到知识抽象过程中的错误。

在本申请的示例性实施例中,所述方法还可以包括:在知识构建过程中,通过知识中断器实现所述新知识与当前知识库的联动。

在本申请的示例性实施例中,所述通过知识中断器实现所述新知识与当前知识库的联动可以包括:

在根据所述本体数据形成新知识时,检测当前知识库中是否存在与将要形成的新知识相同的知识,以及是否存在与将要形成的新知识矛盾的知识;

如果当前知识库中存在与将要形成的新知识相同的知识,则通过所述知识中断器对新知识抽象过程进行中断;

如果当前知识库中存在与将要形成的新知识矛盾的知识,则记录相互矛盾的知识,并发送给研判人员进行研判。

在本申请的示例性实施例中,所述采用创建好的推理知识库对所述本体数据进行知识构建可以包括:

从领域本体演化进程中的时间线上获取演化时间点;

将所述演化时间点的本体数据作为实时数据导入所述推理知识库中;

所述推理知识库根据所述实时数据识别出问题特征,并将识别出的问题特征与所述事实经验知识库和/或常识知识库进行匹配和分类获取决策方案;

根据一个或多个所述演化时间点的实时数据以及所述推理知识库获取的相应的决策方案对所述本体数据进行演化,获取领域本体的决策目标;根据所述决策目标构建新知识。

在本申请的示例性实施例中,所述从领域本体演化进程中的时间线上获取演化时间点可以包括:选出相较于前一时间点,本体数据的预设纬度属性中至少一个发生变化的时间点;

其中,所述预设纬度属性包括以下任意一个或多个:分类、分级和分期。

在本申请的示例性实施例中,所述推理知识库可以包括推理模块;所述推理知识库根据所述实时数据识别出问题特征,并将识别出的问题特征与所述推理知识库中的事实经验知识库和/或常识知识库进行匹配获取决策方案包括:

所述推理模块根据所述实时数据进行情景感知、情景分析和情景推演,识别出所述问题特征,并将识别出的问题特征与所述事实经验知识库和/或常识知识库中的多个案例特征进行匹配获取解决方案;根据情景推演结果和所述解决方案进行方案分类,并根据情景感知结果和所述方案分类获取匹配方案;根据所述匹配方案和预设的处置方案获取最优方案,作为最终的决策方案。

在本申请的示例性实施例中,所述推理模块还用于通过特征字典完成问题特征的标注;

所述推理模块通过特征字典完成问题特征的标注可以包括:通过标注点将前后问题特征进行隔离,并对每个标注点进行知识表示;所述标注点的知识表示可以从以下一个或多个方面进行描述:输入要素、状态要素和输出要素;

所述输入要素包括:环境输入与控制输入;

所述状态要素包括:情景在特定时刻的性质与特征;

所述输出要素包括:状态对外部环境的影响以及状态改变带来的事件损失。

在本申请的示例性实施例中,所述特征字典将问题特征标注后生成的每个特征问题单元分别归类到特征字典中一个唯一编码下,在所述事实经验知识库和/或所述常识知识库中赋予唯一的身份标识id号进行存储,并对事件主题进行概括生成问题特征的知识表示,和/或,

所述推理模块还用于根据标注后生成的多个问题特征单元在关联事件中发生的时间顺序,确定问题特征之间的关系,获取所述本体数据的演化全程;其中,所述关系可以包括并发关系和先后发生关系。

本申请还提出了一种领域知识库的构建装置,可以包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令被所述处理器执行时,实现上述任意一项所述的领域知识库的构建方法。

与现有技术相比,本申请实施例可以包括:根据预设的专家知识库获取实体数据,所述实体数据可以包括:实体的概念和属性以及实体之间的关系;利用预设的抽取技术对所述实体数据进行文本信息抽取,将抽取的文本信息作为本体数据;采用创建好的推理知识库对所述本体数据进行知识构建根据知识构建获取的新知识形成新的领域知识库。通过该实施例方案,建立了一个低成本的、基于知识推理的知识库,实现了自动化决策过程,提升了图谱的数据质量和灵活性,减少数据治理难度和成本。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。

图1为本发明实施例的领域知识库的构建方法流程图;

图2为本发明实施例的采用创建好的推理知识库对所述本体数据进行知识构建的方法示意图;

图3为本发明实施例的推理知识库的整体架构示意图;

图4为本发明实施例的演化全程示意图;

图5为本发明实施例的领域知识库的构建装置组成框图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。

现有技术中包括结构化数据治理技术、非结构化数据治理技术、知识图谱构建技术、本体构建技术、基于专家经验的知识库构建方法、专家系统技术等等。现有技术在工业上有大量应用,但各有不足,包括:

1、常识知识库、经验知识库、推理知识库的构建和使用分离;不能协同起来形成统一知识库;

2、现有知识库以检索为主要应用方向,限制了知识库发挥作用;

3、目前已经建构起的知识库是静态的,一经建构,其结构和知识范围基本确定,更新效率低,不具备动态调整能力;

4、知识库中的知识质量不能得到有效监测和动态优化,知识质量问题严重影响知识应用的效力;

5、知识图谱作为知识表示形式,其表现形式单一,缺乏动态能力。

本申请的核心价值在于应用创新的知识库构建方法,解决当前知识库构建方法的不足。创新思路可以包括:知识库分层分类的新方法、基于知识推理的知识库构建新方法、基于领域本体的知识库构建新方法、动态知识库构建新方法以及基于知识推理的知识库创新应用。

本发明实施例提供了一种领域知识库的构建方法,如图1所示,所述方法可以包括s101-s103:

s101、根据预设的专家知识库获取实体数据,所述实体数据可以包括:实体的概念和属性以及实体之间的关系。

s102、利用预设的抽取技术对所述实体数据进行文本信息抽取,将抽取的文本信息作为本体数据。

在本申请的示例性实施例中,领域本体(即一个知识领域的本体数据)形成的起点有两个,一是专家经验,由专家总结领域知识的结构,抽象实体的概念、属性,并抽象实体间的关系,形成专家知识库;二是利用文本信息的抽取技术对专家知识库中的文体信息做自动化抽取,自动形成本体数据。其中,文本信息的抽取技术可以是nlp(自然语言处理)技术。

在本申请的示例性实施例中,还可以应用事理图谱做为知识图谱的补充,事理图谱采用6要素来表示知识,比知识图谱更具表现能力和灵活性。

s103、采用创建好的推理知识库对所述本体数据进行知识构建根据知识构建获取的新知识形成新的领域知识库。

在本申请的示例性实施例中,所述知识构建可以包括:使所述本体数据之间进行相互印证和相互校验,并指出所述本体数据到知识抽象过程中的错误。

在本申请的示例性实施例中,得到本体信息后,使用自动建构技术(例如上述的预先构建好的推理知识库)对数据库中的数据做知识构建。与原知识工程的区别在于,本体信息之间可以相互印证,相互校验,指出数据到知识抽象过程中的错误,有利于提升知识质量。

在本申请的示例性实施例中,所述方法还可以包括:在知识构建过程中,通过知识中断器实现所述新知识与当前知识库的联动。

在本申请的示例性实施例中,所述通过知识中断器实现所述新知识与当前知识库的联动可以包括:

在根据所述本体数据形成新知识时,检测当前知识库中是否存在与将要形成的新知识相同的知识,以及是否存在与将要形成的新知识矛盾的知识;

如果当前知识库中存在与将要形成的新知识相同的知识,则通过所述知识中断器对新知识抽象过程进行中断;

如果当前知识库中存在与将要形成的新知识矛盾的知识,则记录相互矛盾的知识,并发送给研判人员进行研判。

在本申请的示例性实施例中,在知识抽取的过程中,数据的数据库与当前知识库(即现有的知识库)之间有联动关系,即,已有知识不会重复做数据加工,会指出错误知识,会指出数据库中的数据与现有知识之间的矛盾关系。

在本申请的示例性实施例中,数据库与知识库的联动主要依赖于知识中断器来实现。即,数据库中数据形成部分知识时,先到已有的知识库中查询是否有相同知识,如果已经存在,则中断此类知识的抽象过程;如果发现矛盾,则记录并发送至研判人员提供人工研判。

在本申请的示例性实施例中,新知识形成后可以保存到图数据库,以知识图谱和事理图谱的形式对外展示。

在本申请的示例性实施例中,下面将详细介绍如何采用推理知识库实现对本体数据进行知识构建。

在本申请的示例性实施例中,如图2所示,所述采用创建好的推理知识库对所述本体数据进行知识构建可以包括s201-s204:

s201、从领域本体演化进程中的时间线上获取演化时间点。

在本申请的示例性实施例中,可以首先确定出演化进程中的时间点,并从中选取出重要的时间点,即,演化时间点。

在本申请的示例性实施例中,所述从领域本体演化进程中的时间线上获取演化时间点可以包括:选出相较于前一时间点,本体数据的预设纬度属性中至少一个发生变化的时间点;

其中,所述预设纬度属性包括以下任意一个或多个:分类、分级和分期。

在本申请的示例性实施例中,选取问题特征划分时间点的原则可以为该时间点相对于前一时间点,突发事件(如领域本体演化事件)的分类、分级、分期三个维度属性至少有一个发生了改变。

s202、将所述演化时间点的本体数据作为实时数据导入所述推理知识库中。

s203、所述推理知识库根据所述实时数据识别出问题特征,并将识别出的问题特征与所述事实经验知识库和/或常识知识库进行匹配和分类获取决策方案。

在本申请的示例性实施例中,推理知识库的整体架构可以如图3所示,推理知识库是为决策者应对决策而建立,推理知识库的构建要依赖于常识知识库和事实经验知识库。

在本申请的示例性实施例中,推理知识库是决策分析与现实世界互动交互的桥梁,使得决策建立在实时信息(实时本体数据)的基础上,系统内部及环境外部的不确定性、异常和突变行为都能实时反映到决策中。推理知识库不仅避免了连续优化的决策效率低下,而且实现了对事件的实时监控和干预。

在本申请的示例性实施例中,推理知识库的推理依据是识别决策的问题特征,以此匹配事实经验知识库的安全特征,从而获取最终的决策方案。

在本申请的示例性实施例中,如图3所示,所述推理知识库可以包括推理模块;所述推理知识库根据所述实时数据识别出问题特征,并将识别出的问题特征与所述推理知识库中的事实经验知识库和/或常识知识库进行匹配获取决策方案包括:

所述推理模块根据所述实时数据进行情景感知、情景分析和情景推演,识别出所述问题特征,并将识别出的问题特征与所述事实经验知识库和/或常识知识库中的多个案例特征进行匹配获取解决方案;根据情景推演结果和所述解决方案进行方案分类,并根据情景感知结果和所述方案分类获取匹配方案;根据所述匹配方案和预设的处置方案获取最优方案,作为最终的决策方案。

在本申请的示例性实施例中,基于推理知识库的决策推理过程示意图可以如图3所示。可以首先通过步骤s201确定演化进程中的时间点,选取出重要的时间点,然后利用特征词典完成问题特征的标注。

在本申请的示例性实施例中,所述推理模块还用于通过特征字典完成问题特征的标注;

所述推理模块通过特征字典完成问题特征的标注可以包括:通过标注点将前后问题特征进行隔离,并对每个标注点进行知识表示;所述标注点的知识表示可以从以下一个或多个方面进行描述:输入要素、状态要素和输出要素;

所述输入要素包括:环境输入与控制输入;

所述状态要素包括:情景在特定时刻的性质与特征;

所述输出要素包括:状态对外部环境的影响以及状态改变带来的事件损失。

在本申请的示例性实施例中,可以结合决策目标进一步提炼形成推理过程的知识表示,其中推理的标注点r将前后问题特征隔离,是时刻t知识实例推理至时刻t~t+△t知识实体的关键,其知识表示可从输入要素、状态要素、输出要素三个方面描述,刻画出推理过程的知识表示,连接前后两个相邻时刻的片段。a输入要素:输入要素的研究范畴为环境输入与控制输入两个方面。b状态要素:状态要素重在描述情景在特定时刻的性质与特征,将考察承灾时刻状态与情景生命周期两个方面。c输出要素:输出要素体现为状态对外部环境的影响、状态改变带来的事件损失两个方面。

在本申请的示例性实施例中,所述特征字典将问题特征标注后生成的每个特征问题单元分别归类到特征字典中一个唯一编码下,在所述事实经验知识库和/或所述常识知识库中赋予唯一的身份标识id号进行存储,并对事件主题进行概括生成问题特征的知识表示,和/或,

在本申请的示例性实施例中,如图4所示,所述推理模块还用于根据标注后生成的多个问题特征单元在关联事件中发生的时间顺序,确定问题特征之间的关系,获取所述本体数据的演化全程;其中,所述关系可以包括并发关系和先后发生关系。

s204、根据一个或多个所述演化时间点的实时数据以及所述推理知识库获取的相应的决策方案对所述本体数据进行演化,获取领域本体的决策目标;根据所述决策目标构建新知识。

在本申请的示例性实施例中,获取重要时间点(时刻t1)后可以将时刻t1的本体数据导入创建好的推理知识库中,并在推理知识库中进行数据状态更新,此刻获取上一次领域本体演化得到的决策目标(如目标g1、g2、gn),并在时刻t1+△t获取推理知识库根据识别出的问题特征获取的决策方案,结合上一次演化得到的决策目标和该次的决策方案进行目标演化,获得新的决策目标(如目标g4、g5、gm),即获取进一步演化后的领域本体。

在本申请的示例性实施例中,通过推理知识库进行知识推理在知识库中的构建过程中的作用至少包括以下两点:

1、自动形成新知识:

形成新知识依赖于对数据库(存储有本体数据)中的全部字段(或特征)做更大范围的组合,不再限于由专家指出的分析规则,而是使用近似于随机组合的方式,利用数据库中的数据进行对比、关联、分析,进而形成新的知识。

这个过程中知识的构建限制了数据的过度组合,保证了知识建构自动化的可行性。举例说明:原知识库中人员有父子关系但是没有爷孙关系,本体知识构建时设计人与人之间的关系可以有组合关系,如爷孙关系。那么在知识库自动构建时,系统会从数据库中自动抽象出爷孙关系,增加了知识的数量和深度。

2、纠正知识中的矛盾和错误:

知识构建过程中,因为人为录入原因,专家分类原因,自动构建错误原因等等,都会造成知识库中的知识有矛盾或错误,更常见的是知识失去时效性。利用知识推理技术,会自动发现和排查知识库中的矛盾错误。实际的技术实现就是周期性的对新知识和旧知识做相似度的对比,对于同类、同内容的知识进行对比分析。具体方法可以包括:当同类数据内容不一致,特别是部分实体内容完全一致,但整体知识不一致的情况下,认为是有矛盾的知识。

在本申请的示例性实施例中,基于推理知识库,以创新方式建立符合领域特征的本体构建方法,根据领域本体和演化后的领域本体不断对领域知识库进行创建和更新,以一种低成本,高得用性的方法,建立一个基于知识推理的领域知识库,成为一种跨业的有领域特征的知识库系统,为决策提供有知识依据的自动化决策过程;提升了知识图谱的数据质量,提升知识图谱的灵活性,融合专家系统的能力,结合事理图谱的创新方法,减少对专家经验的依赖,减少数据治理难度和成本。

在本申请的示例性实施例中,本申请综合专家经验形成的经验事实库、常识库等多类知识源,提供了一个符合领域知识库特点的综合性构建方法:

1、在不同类型知识库(如常识库、经验库和推理库等)中分别使用知识推理技术,对已有的知识,依赖一阶逻辑推理的方法对知识进行应用。一般的做法可以包括:对问题作结构化分析(基于nlp的文本结构化);形成查询条件;对知识库中的知识做查询;得到相关知识后应用一阶逻辑推理得到结论;到知识库中校验结论的合理性;返回结论。

2、除在各个知识库内分别推理之后,还有在各个知识库之前的交叉分析和验证,增强分析的全面性和准确性。

3、各个知识库之间对结论既可以提供检验,也可提供补充知识,形成统一的论证过程和结论。

本发明实施例还提供了一种领域知识库的构建装置11,如图5所示,可以包括处理器11和计算机可读存储介质12,所述计算机可读存储介质12中存储有指令,当所述指令被所述处理器11执行时,实现上述任意一项所述的领域知识库的构建方法。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。


技术特征:

1.一种领域知识库的构建方法,其特征在于,所述方法包括:

根据预设的专家知识库获取实体数据,所述实体数据包括:实体的概念和属性以及实体之间的关系;

利用预设的抽取技术对所述实体数据进行文本信息抽取,将抽取的文本信息作为本体数据;

采用创建好的推理知识库对所述本体数据进行知识构建根据知识构建获取的新知识形成新的领域知识库。

2.根据权利要求1所述的领域知识库的构建方法,其特征在于,所述知识构建包括:使所述本体数据之间进行相互印证和相互校验,并指出所述本体数据到知识抽象过程中的错误。

3.根据权利要求1所述的领域知识库的构建方法,其特征在于,所述方法还包括:在知识构建过程中,通过知识中断器实现所述新知识与当前知识库的联动。

4.根据权利要求3所述的领域知识库的构建方法,其特征在于,所述通过知识中断器实现所述新知识与当前知识库的联动包括:

在根据所述本体数据形成新知识时,检测当前知识库中是否存在与将要形成的新知识相同的知识,以及是否存在与将要形成的新知识矛盾的知识;

如果当前知识库中存在与将要形成的新知识相同的知识,则通过所述知识中断器对新知识抽象过程进行中断;

如果当前知识库中存在与将要形成的新知识矛盾的知识,则记录相互矛盾的知识,并发送给研判人员进行研判。

5.根据权利要求1所述的领域知识库的构建方法,其特征在于,所述采用创建好的推理知识库对所述本体数据进行知识构建包括:

从领域本体演化进程中的时间线上获取演化时间点;

将所述演化时间点的本体数据作为实时数据导入所述推理知识库中;

所述推理知识库根据所述实时数据识别出问题特征,并将识别出的问题特征与事实经验知识库和/或常识知识库进行匹配和分类获取决策方案;

根据一个或多个所述演化时间点的实时数据以及所述推理知识库获取的相应的决策方案对所述本体数据进行演化,获取领域本体的决策目标;根据所述决策目标构建新知识。

6.根据权利要求5所述的领域知识库的构建方法,其特征在于,所述从领域本体演化进程中的时间线上获取演化时间点包括:选出相较于前一时间点,本体数据的预设纬度属性中至少一个发生变化的时间点;

其中,所述预设纬度属性包括以下任意一个或多个:分类、分级和分期。

7.根据权利要求6所述的领域知识库的构建方法,其特征在于,所述推理知识库包括推理模块;所述推理知识库根据所述实时数据识别出问题特征,并将识别出的问题特征与所述推理知识库中的事实经验知识库和/或常识知识库进行匹配获取决策方案包括:

所述推理模块根据所述实时数据进行情景感知、情景分析和情景推演,识别出所述问题特征,并将识别出的问题特征与所述事实经验知识库和/或常识知识库中的多个案例特征进行匹配获取解决方案;根据情景推演结果和所述解决方案进行方案分类,并根据情景感知结果和所述方案分类获取匹配方案;根据所述匹配方案和预设的处置方案获取最优方案,作为最终的决策方案。

8.根据权利要求7所述的领域知识库的构建方法,其特征在于,所述推理模块还用于通过特征字典完成问题特征的标注;

所述推理模块通过特征字典完成问题特征的标注包括:通过标注点将前后问题特征进行隔离,并对每个标注点进行知识表示;所述标注点的知识表示从以下一个或多个方面进行描述:输入要素、状态要素和输出要素;

所述输入要素包括:环境输入与控制输入;

所述状态要素包括:情景在特定时刻的性质与特征;

所述输出要素包括:状态对外部环境的影响以及状态改变带来的事件损失。

9.根据权利要求8所述的领域知识库的构建方法,其特征在于,所述特征字典将问题特征标注后生成的每个特征问题单元分别归类到特征字典中一个唯一编码下,在所述事实经验知识库和/或所述常识知识库中赋予唯一的身份标识id号进行存储,并对事件主题进行概括生成问题特征的知识表示,和/或,

所述推理模块还用于根据标注后生成的多个问题特征单元在关联事件中发生的时间顺序,确定问题特征之间的关系,获取所述本体数据的演化全程;其中,所述关系包括并发关系和先后发生关系。

10.一种领域知识库的构建装置,包括处理器和计算机可读存储介质,所述计算机可读存储介质中存储有指令,其特征在于,当所述指令被所述处理器执行时,实现如权利要求1-9任意一项所述的领域知识库的构建方法。

技术总结
本申请实施例公开了一种领域知识库的构建方法和装置,该方法包括:根据预设的专家知识库获取实体数据,实体数据包括:实体的概念和属性以及实体之间的关系;利用预设的抽取技术对实体数据进行文本信息抽取,将抽取的文本信息作为本体数据;采用创建好的推理知识库对本体数据进行知识构建根据知识构建获取的新知识形成新的领域知识库。通过该实施例方案,建立了一个低成本的、基于知识推理的知识库,实现了自动化决策过程,提升了图谱的数据质量和灵活性,减少数据治理难度和成本。

技术研发人员:于霄;任鑫琦
受保护的技术使用者:北京明略软件系统有限公司
技术研发日:2020.02.27
技术公布日:2020.06.26

介绍一种领域知识库的构建方法和装置与流程的相关内容如下: