知识图谱来源于三个方面的技术进步。一是符号人工智能、二是万维网、三是自然语言处理。
在经典人工智能领域,以知识表示为中心的符号人工智能和以神经网络为中心的连接人工智能一直是两个主流方向。神经网络借助深度学习解决了大量感知层面的问题,如视觉、听觉等。知识图谱一定程度上代表符号人工智能的发展方向,被认为是进一步解决认知层面的问题,如语言理解、常识推理等,所不可或缺的技术手段。
在万维网领域,Web之父Tim Berners-Lee于1998年提出了语义网(Semantic Web)的概念。传统Web是通过建立网页之间的链接发展起来的。语义网的初衷也是希望能像传统Web一样,建立数据或对象的直接链接,形成一个庞大的链接数据库或知识库。这种结构化的链接数据将使得Web上的信息更加易于被机器所理解和处理,而不仅仅像网页那样只是供人浏览。谷歌知识图谱的主要数据来源Freebase就是早期的语义网项目。
在自然语言处理领域,从文本中自动或半自动抽取实体及实体之间关系的技术飞速发展,在一定程度上解决了传统知识库获取面临的可扩展性差的问题,从而提升了各种知识图谱构建的效率。
当前,知识图谱技术和方法正在进一步与深度学习等进一步融合。目前人工智能领域的一个重要研究方向就是怎样基于神经网络来处理符号和实习知识图谱的处理和常识推理。可以预见,知识图谱将在人工智能相关的各个领域得到更加广泛的应用。