跳到主要内容
研究

自动驾驶知识注入学习的介绍

raybet雷竞技ios下载博世研究博客|作者:科里·汉森2021-06-24

科里·亨森

合著者: Ruwan Wickramarachchi(南卡罗莱纳大学人工智能研究所)

在要求5级自动驾驶的场景中,自动驾驶还远远没有完全实现。将知识图谱和机器学习相结合的知识注入学习是克服自动驾驶挑战的关键。一个介绍。

自2004年DARPA大挑战赛首次展出以来,自动驾驶技术已经取得了重大进展。从那时起,自动驾驶一直是探索机器学习能力和局限性的关键测试平台。由于驾驶需要理解复杂的场景,并将多模态感官输入映射到控制序列,机器学习已被证明可以通过将其作为非线性控制问题来解决这一挑战。此外,它还显示出了巨大的泛化潜力,因为以前学习的规则通常可以应用于新的驾驶场景,或者从经验中学到的新的复杂规则。自动驾驶领域机器学习的快速发展进一步得益于最近的可用性和多样性的良好数据集

但即使取得了这些最新进展,该技术仍远未达到完全5级自动驾驶的要求。机器学习的技术挑战包括但不限于安全性、计算、架构、验证和适应性。此外,全自动驾驶及其广泛使用也带来了新的挑战,包括用户接受度、问责制、可解释性以及法律、道德和社会边界的符合性。
作为克服这些挑战的潜在解决方案,我们引入了概念knowledge-infused学习,这涉及到知识图与机器学习的集成。我们相信,知识图谱的智能集成将丰富车辆对复杂驾驶情况的理解,从而增强其应对许多技术和非技术挑战的能力。

在下一篇文章中,我们将说明使用知识图作为学习的默认数据模型的情况,并将研究知识图和机器学习之间的协同作用,以实现知识注入学习。

知识图作为学习的默认数据模型

自动驾驶需要对车辆的情况有深入的了解,以便对车辆的行为做出明智的决定。这种理解来源于有关驾驶场景的观测数据,这些数据以不同的方式从不同的来源提供,包括激光雷达、雷达、摄像机和许多其他CAN总线信号(C控制一个意图Network)。因此,将这些信息融合成一个统一的、连贯的表示,以进行稳健决策的能力,是自动驾驶所需的复杂机器推理能力的先决条件。

去年我们介绍了这个主题知识的利弊(符号知识)和机器学习(子符号知识)。

“符号化方法和子符号化方法是追求这种意义创造能力的两种经典技术。子符号或数据驱动的方法试图通过在现实世界中进行观察来建模事件的统计规律;然而,它们仍然难以解释,也缺乏自然地吸收外部知识的机制。相反,符号或知识驱动的方法结合了结构化的知识图,根据公理原则执行符号推理,并且在推理处理中更具可解释性。然而,他们往往缺乏估计推断的统计显著性的能力。为了解决这些问题,我们建议使用混合方法作为综合两种方法长处的一般框架。”(Oltramari,2020

这种方法深受阿姆斯特丹自由大学的Xander Wilcke思想的影响。2017年,Xander首次提出采用知识图作为从异构中学习的默认数据模型知识

“只要我们可以假设所有相关和不相关的信息都出现在输入数据中,我们就可以设计深度(学习)模型,建立中间表示来筛选相关特征。然而,这些模型通常是特定于领域的,并且是为手头的任务量身定制的,因此不适合学习异质知识:来自不同领域的不同类型的信息。
要做到这一点,我们首先需要一个数据模型能够自然地表达不同类型的知识,以尽可能可用的形式,并满足尽可能多的用例。……[我们]认为知识图谱是一个合适的候选。”(证明,2017

Wilcke的论点的有效性集中在知识图和机器学习的互补优势和劣势,以及通过它们的集成产生的协同效应。

更具体地说,混合知识注入学习系统提供了许多广受欢迎的功能:
  1. 无缝集成异构信息
  2. 大规模搜索和更新语义注释数据
  3. 跨数据集重用知识资源
  4. 逻辑推理
  5. 得出明确的解释和解释

通过知识注入的学习实现协同

虽然机器学习已被证明在解决许多计算挑战方面是有效的,但机器智能的全部潜力仍远未实现,因为机器学习在处理可解释性、可解释性、问责性和缺乏高质量训练数据等问题时往往存在不足。在子符号架构中利用知识——包括领域知识和常识性知识,这些知识通常以知识图、分类法、词汇表和其他符号表示形式提供——可以帮助机器学习克服这些挑战。集成机器学习/子符号表示与符号表示的需求已经讨论了很多年。2003年,莱斯利·Valiant指出了计算机科学中的三个问题,其中之一是“为认知计算描述语义”。

这里的目的是确定一种看待和处理常识知识的方式,这种方式与我们认为的智能认知行为的两个最基本方面是一致的,并且可以支持这两个最基本的方面:从经验中学习的能力,以及从已经学到的东西中推理的能力。因此,我们正在寻求一种知识的语义学,它可以从计算上支持智能行为的基本现象。

近20年后,这仍然是一个悬而未决的问题。然而,在人工智能“神经符号计算/知识注入学习”中出现了一个新颖的想法,旨在通过从经验中学习和从所学到的东西中推理来实现Valiant的愿景-智能认知行为。从广义上讲,神经符号计算中的知识是用符号形式表示的,而学习、推理和推理是用神经符号来实现的网络.然而,随着Sheth et al. point,这将需要解决“阻抗不匹配”,这是由于符号和子符号系统之间的表示和抽象的差异。

最近,试图弥合符号/次符号鸿沟的技术有所上升。Sheth等人将最近的工作归类为连续的浅、半深和深输液知识.在最近的方法中,知识图嵌入(KGEs)仍然是最广泛采用的方法,用于表示知识图谱中的知识并将其与机器学习架构集成。KGEs将KG中的实体和关系转换为连续向量空间中的向量/矩阵,允许其他子符号方法使用它们。虽然这种转换不是无损的,但最近提出了许多KGE方法来限制转换损失显式地利用类型和层次结构等语义信息.即使在目前的发展阶段,与目前的机器学习相比,kge在实现知识注入学习的目标方面表现出了出色的潜力,特别是可解释性。

这张图显示了知识图嵌入(kge),这是最广泛采用的表示知识的KGs方法,并将它们集成到机器学习架构中
知识图嵌入(Knowledge Graph Embeddings, kge)仍然是最广泛采用的表示知识知识的方法,并将它们集成到机器学习架构中

结论

总之,在接下来的几年里,我们预计会有令人兴奋的混合人工智能系统和技术的新研究,比如知识注入学习,这将能够无缝集成和统一机器学习和知识图。这项技术有着巨大的前景和潜力,可以克服自动驾驶面临的一些挑战。

你对这个话题有什么看法?

请随时通过领英分享或直接与我联系。

作者:科里·汉森

Cory是博世研究与技术中心的首席研究科学家,专注于应用知识表示和语义技术raybet雷竞技ios下载实现自动驾驶。他还担任Wright State University的兼职教授。在加入博世之前,他在华盛顿州立大学raybet雷竞技ios下载获得了计算机科学博士学位,在那里他曾在knoe.sis中心工作,应用语义技术来表示和管理Web上的传感器数据。

科里·亨森

分享到: