中国人工智能发展报告:知识工程(2019—2020)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.3 大知识工程

费根鲍姆曾经定义知识工程为“设计和构建专家系统及其他基于知识的系统的艺术”。然而,大知识和大知识系统如此庞大且复杂,导致传统知识工程技术根本无法构建高级大知识系统。

定义2.3 大知识工程(Big Knowledge Engineering

大知识工程是关于大知识系统的工程,即使用科学方法获取大知识并朝着某个重大目标去设计、构造、应用大知识系统的艺术。

大知识工程的生命周期如下,其中标*的环节往往是非大知识工程项目所缺失的。

● 大目标*:在一开始就确定大知识工程的研究和应用目标是至关重要的。

● 大数据:拥有尽可能多的数据类型和数据数目。利用先进的数据分析技术去处理、挖掘和管理数据。

● 大知识*:极强的大规模知识的挖掘、连接、融合和管理能力。

● 大技术*:利用所有可用的技术和工具(不限于信息技术)去挖掘、验证和组织知识。

● 大服务*:自主研发一套满足不同潜在用户不同需求的技术和工具集。

● 大生命周期:通常来说,知识获取和更新的过程是永不停止的。同样地,管理和服务能力的改进和更新也是永不停止的。因此,只要大知识系统还在运行,大知识工程就要继续运转。

以上关于大知识工程的定义都只是指导性原则。基于上述分析,可以有不同的大知识工程模型。陆汝钤等人给出了大知识工程的生命周期模型作为一种可能的范式:

● 分析阶段:决定大知识和大知识系统的科学目标和服务目标。

● 设计阶段:确定大知识的框架和大知识系统的结构。首要任务是拥有一个大知识管理系统,比如KGMS可能是这类系统的原型。本体结构与语义网是知识表示的两个示例。

● 工具开发阶段:开发用于知识获取、系统构建和用户服务的技术和工具。例如,实现类似OpenIE或知识嵌入技术的机器学习算法。

● 知识采集阶段:使用各种可能的技术,从各种可能的来源去获取并测试数据和知识碎片,构建干净数据资源,例如从其他来源抽取信息或从网上获取数据。

● 整合阶段:通过解耦、挖掘、转化和融合所有知识去构建大知识。进而将大知识与第三步中开发的工具结合起来构建大知识系统。例如概率知识融合或多语言来源整合。

● 评估阶段:根据MC1~MC5测试大知识,如有必要可以再加上其他的MC标准。对知识元素分配可信度,例如置信度计算或知识补全。

● 验证阶段:根据MC6测试大知识系统,如有必要也可以加上其他MC标准。检查知识管理和服务功能的可用性与正确性,例如谷歌知识图谱搜索助手。

● 应用阶段:在实际案例中使用大知识系统。维持系统运转,如有必要,可以在前面的某个步骤中复制一个线程,来获取反馈信息。例如,NELL的永不停歇语言学习。

为了便于理解,图2-1给出了上述10个MC性质与大知识、大知识系统、大知识工程等概念之间的逻辑关系。

img

图2-1 大知识、大知识系统与大知识工程的逻辑关系