领域大数据知识图谱专题
基于知识图谱的推荐系统研究综述
秦川, 祝恒书, 庄福振, 郭庆宇, 张琦, 张乐, 王超, 陈恩红, 熊辉
中国科学: 信息科学, 2020, 50(7): 937-956
摘要 推荐系统旨在为用户推荐个性化的在线商品或信息,其广泛应用于众多Web场景之中,来处理海量信息数据所导致的信息过载问题,以此提升用户体验.鉴于推荐系统强大的实用性,自20世纪90年代中期以来,研究者针对其方法与应用两方面,进行了大量广泛的研究.近年来,很多工作发现知识图谱中所蕴含的丰富信息可以有效地解决推荐系统中存在的一系列关键问题,例如数据稀疏、冷启动、推荐多样性等.因此,本文针对基于知识图谱的推荐系统这一领域进行了全面的综述.具体地,首先简单介绍推荐系统与知识图谱中的一些基本概念.随后,详细介绍现有方法如何挖掘知识图谱不同种类的信息并应用于推荐系统.此外,总结了相关的一系列推荐应用场景.最后,提出了对基于知识图谱的推荐系统前景的看法,并展望了该领域未来的研究方向.
关键词 知识图谱; 推荐系统; 协同过滤; 异质信息网络; 图嵌入; knowledge graph; recommender system; collaborative filtering; heterogeneous information network; graph embedding;
Chuan QIN, Hengshu ZHU, Fuzhen ZHUANG, et al. A survey on knowledge graph-based recommender systems. Sci Sin Inform, 2020, 50(7): 937-956, doi: 10.1360/SSI-2019-0274
领域大数据知识图谱专题
科技大数据知识图谱构建方法及应用研究综述
周园春, 王卫军, 乔子越, 肖濛, 杜一
中国科学: 信息科学, 2020, 50(7): 957-987
摘要 以研究科学创新与演化规律为目的的科学学近年来迎来了进一步的发展,科技大数据领域知识图谱在其中发挥了重大的作用.本文将从科技大数据知识图谱构建及应用研究角度,对科学学研究过程中发挥重大推动作用的科技领域知识图谱技术进行系统、深入的综述,阐述科技大数据知识图谱构建过程中涉及的科技实体抽取、科技实体消歧、科技关系抽取、科技关系推断等问题,对科技实体推荐、科技社区发现、科技实体评价、学科交叉以及学科演化等科技大数据知识图谱分析挖掘方法进行系统梳理,并给出科技大数据知识图谱未来的研究及应用方向.
关键词 科技大数据; 科技领域知识图谱; 科学学; 科技数据挖掘; 图神经网络; big data of sci-tech; knowledge graph of sci-tech domain; science of science; sci-tech data mining; graph neural network;
Yuanchun ZHOU, Weijun WANG, Ziyue QIAO, et al. A survey on the construction methods and applications of sci-tech big data knowledge graph. Sci Sin Inform, 2020, 50(7): 957-987, doi: 10.1360/SSI-2019-0271
领域大数据知识图谱专题
面向大数据领域的事理认知图谱构建与推断分析
王军平, 张文生, 王勇飞, 孙正雅
中国科学: 信息科学, 2020, 50(7): 988-1002
摘要 随着大数据对全球生产、流通、分配、消费等国计民生领域产生重要影响,事理作为认知智能重要概念,不仅帮助人们发现大数据所蕴含的国计民生的线索与发展规律,而且帮助人们更好认知人机物三元世界未来发展趋势.考虑到人机物事理动态演化是工业大数据有别于其他行业大数据处理的本质区别,本文从人机物事理动态演化特性智能认知着手,结合传统知识图谱在互联网领域取得的成功经验,提出了面向大数据领域的事理认知图谱构建与推断分析.首先论述了事理认知图谱对推动认知智能研究发展的贡献,剖析了它与知识图谱异同之处,深度理解人类社会发展变化规律的重要价值.其次阐述了事理抽取与泛化、多模态联合网络化合成表示、进化认知和推断分析等关键技术研究最新进展以及面临的挑战.最后,结合我们课题组在事理认知图谱的研究进展情况,归纳总结了事理认知图谱在预防网络电话诈骗和安全生产管控等领域最新应用效果.本文结尾总结和展望事理认知图谱的未来研究方向和发展前景.
关键词 工业大数据; 知识图谱; 事理认知; 人机行为演化分析; industrial big data; knowledge graph; event logic cognitive; analysis of human-machine behavior evolution;
Junping WANG, Wensheng ZHANG, Yongfei WANG, et al. Constructing and inferring event logic cognitive graph in the field of big data. Sci Sin Inform, 2020, 50(7): 988-1002, doi: 10.1360/SSI-2019-0273
领域大数据知识图谱专题
基于简介文本的中文人物关系图谱属性补全与纠错
杨一帆, 马进, 王海涛, 何正球, 陈文亮, 张民
中国科学: 信息科学, 2020, 50(7): 1003-1018
摘要 一个准确丰富的人物关系图谱不仅能够为大众提供人物实体的清晰介绍和人物之间的相互关联,而且能够为智能服务系统提供有效的知识支持.目前大多知识来源均以百科类表格数据为起点,在此基础上构建知识图谱.本文主要描述如何充分利用百科类文本数据构建高质量的人物关系图谱.为解决表格数据中存在属性缺失和错误的问题,我们采用模式匹配和深度学习模型相结合的策略从文本数据中自动学习属性值,进行属性补全和纠错,有效提高了知识图谱的覆盖率和正确率.
关键词 知识图谱; 人物关系图谱; 属性补全与纠错; 信息抽取; knowledge graph; inter-personal relation knowledge graph; attribute identification; information extraction;
Yifan YANG, Jin MA, Haitao WANG, et al. Attribute identification for Chinese inter-personal relation knowledge graph based on encyclopedic text. Sci Sin Inform, 2020, 50(7): 1003-1018, doi: 10.1360/SSI-2019-0243
领域大数据知识图谱专题
顾及时空特征的地理知识图谱构建方法
张雪英, 张春菊, 吴明光, 闾国年
中国科学: 信息科学, 2020, 50(7): 1019-1032
摘要 地理知识是人类对地理现象或事物空间分布、演变过程和相互作用规律的认知结果.当前大数据环境下的地理信息服务,普遍存在"数据海量、信息爆炸、知识难求"现象.地理知识图谱是一种利用语义网络对地理概念、实体及其相互关系进行形式化描述的知识系统,在地理知识理解、地学问题求解、时空预测决策等方面具有巨大的应用潜力.地理知识除了具有通用知识的内涵和特点之外,还具有特定的时空特征和地学机理特点.因此,地理知识图谱构建和应用既具有一定的通用性,同时具有一定的专业特殊性.本文结合地理知识的时空特征和知识图谱的表达形式,提出了一种顾及时空特征的地理知识图谱构建方法.首先,系统梳理了地理知识图谱构建的基本思路和技术流程,并简要阐述了地理知识获取、地理知识抽象与表达、地理知识组织与管理3个关键环节的主要研究内容及其进展.其次,从地理学回答的基本问题出发,对地理知识的内容特征进行概括和抽象,构建了涵盖"地理概念–地理实体–地理关系" 3个层次的地理知识表达模型,用于描述不同粒度地理知识语义单元的基本组成及其逻辑关系.最后,借鉴知识图谱采用的语义网络知识表示方法,提出了基于"过程–关系"的地理知识表示方法.该方法以时间和空间特征为基本条件,以地理实体的状态划分为基础,实现了地理实体演化过程以及复杂地理关系的形式化描述.本文的研究成果有效解决了融合时空间维度的地理知识结构化表达和形式表示问题,为地理知识获取、融合、推理与应用奠定了基础.同时,在地质、环境、气象等地学领域具有一定通用性,对地学知识服务的推进具有重要参考价值.
关键词 地理实体; 时空特征; 地理知识表达模型; 地理知识形式化; 地理知识图谱; geographical entity; spatio-temporal feature; geographical knowledge representation model; geographical knowledge formalization; geographical knowledge graph;
Xueying ZHANG, Chunju ZHANG, Mingguang WU, et al. Spatio-temporal features based geographical knowledge graph construction. Sci Sin Inform, 2020, 50(7): 1019-1032, doi: 10.1360/SSI-2019-0269
领域大数据知识图谱专题
基于篇章级事件表示的文本相关度计算方法
刘铭, 郑子豪, 秦兵, 刘一仝, 李阳
中国科学: 信息科学, 2020, 50(7): 1033-1054
摘要 随着网络信息的剧增,信息流服务备受用户关注.在信息流服务中,如何衡量文本之间的相关度进而从多来源的信息渠道中过滤掉冗余信息提升推荐满意度成为至关重要的环节.当前主流的文本相关度计算方法均是将文本表示为向量,进而通过衡量向量之间的相似度来度量文本间的相关度.然而,信息流中的文本多为新闻文本,这些文本的核心是其描述的事件,基于此需要从事件的角度挖掘文本的核心特征进而利用其计算文本间的相关度.当前针对事件的研究大多数着眼于句子级别.事实上,在计算文本相关度时,需要从篇章级别把握文章的内容.故此,篇章级的事件分析更有影响力.为此,本文在句子级事件抽取的基础上,提出了一种篇章级的事件表示方法,其利用句子级事件的抽取结果构建篇章事件连通图,并选取图中重要的节点作为篇章级事件的代表,之后利用篇章级的事件表示结果来度量文本之间的相关度.实验显示,本文提出的文本相关度计算方法要远好于传统的文本相关度计算方法.
关键词 篇章事件连通图; 篇章级事件相关度; 文本排序; 关键子句筛选; 子句连通图; passage event connection graph; passage-level event correlation; textrank; selection of key sentence; sentence-level connection graph;
Ming LIU, Zihao ZHENG, Bing QIN, et al. Text correlation calculation based on passage-level event representation. Sci Sin Inform, 2020, 50(7): 1033-1054, doi: 10.1360/SSI-2019-0272
领域大数据知识图谱专题
基于旅游知识图谱的可解释景点推荐
高嘉良, 仇培元, 余丽, 黄宗财, 陆锋
中国科学: 信息科学, 2020, 50(7): 1055-1068
摘要 景点推荐系统可以帮助游客过滤大量的无关信息,还能辅助商家发掘潜在的顾客.然而,现有的基于传统方法的推荐系统,如基于内容的推荐或协同过滤系统,虽推荐过程相对透明直观,但由于数据稀疏性的存在,推荐结果往往不够准确;基于深度学习的推荐方法,虽在一定程度上提高了推荐结果的精度,但由于缺乏可解释性和透明度,难以满足部分用户理解推荐依据的愿望,也阻碍了此类方法的推广应用.为了解决当前方法所存在的局限,本文引入基于知识图谱的景点推荐框架,将推荐过程与知识图谱嵌入相结合,推断用户兴趣在知识图谱上的传播路径,以此作为推荐依据.此外,本文通过对真实旅游数据的多角度时空分析,探究旅游活动的时空规律,并将其应用于景点推荐框架中,提出一种面向旅游的基于知识图谱的可解释推荐方法——Geo-RippleNet,并通过构建基于开放网络资源的旅游知识图谱,对Geo-RippleNet进行了全面的实验验证.结果表明,本文提出的基于知识图谱的景点推荐方法,不仅可以最大限度地吸收知识图谱丰富的语义信息,从而实现可观的性能提升,还能充分利用图谱的关系知识,推理兴趣传播路径,以增强推荐结果的可解释性.此外,将旅游活动的时空规律融入到上述推荐框架中,能够还原用户出游和决策的时空过程,进一步提高方法的性能表现.
关键词 旅游知识图谱; 景点推荐; 可解释性; 推荐系统; 旅游管理; tourism knowledge graph; attraction recommendation system; interpretability; recommendation system; tourism management;
Jialiang GAO, Peiyuan QIU, Li YU, et al. An interpretable attraction recommendation method based on knowledge graph. Sci Sin Inform, 2020, 50(7): 1055-1068, doi: 10.1360/SSI-2019-0268