工业物联网数据管理中的系统负载均衡最优化问题及其求解
张凌哲, 朱妤晴, 安彦哲, 訾源, 王建民
中国科学: 信息科学, 2024, 54(10): 2343-2367
摘要 工业物联网数据管理与数字中国基础设施建设紧密相关,是支撑提取工业大数据价值的基础.由于工业物联网数据源于设备,工业物联网数据管理系统面临着数据量、数据到达速度、负载多样性等更严峻的大数据挑战.为了应对这些挑战,工业物联网数据管理系统必须进行负载均衡,以充分利用可扩展的计算资源、提升系统性能.现有的负载均衡方法未能充分利用工业物联网数据典型的时序特性,无法应对工业物联网数据管理的上述挑战.本文针对工业物联网数据的时序特性,以读写差异化均衡为约束,建模了负载均衡最优化问题,以匹配工业物联网数据的读写分离特性;提出了负载均衡方案TsLBOpt,集成了简化系统架构的非侵入式负载统计与估算方法,利用分片细分与自适应复制以扩充解空间的整数规划最优化求解方法,以及基于贪心策略最小化数据迁移代价的数据重分布方法.TsLBOpt在清华大学获日内瓦国际发明展金奖的开源时序数据管理系统IginX中进行了实现,并基于多容器构建的集群系统开展了大量实验,结果表明,本文提出的TsLBOpt相比常用的哈希方法、经典的启发式热数据迁移法、前沿工作DynaHash分别可提升系统整体性能至2倍、10倍、4倍以上,且可有效应用于资源异构、组件异构的异构集群系统中.
关键词 工业物联网; 物联网数据管理; 负载均衡; 性能最优化; 时序数据; industrial Internet-of-Things; IoT data management; load balancing; performance optimization; time series data
Lingzhe ZHANG, Yuqing ZHU, Yanzhe AN, et al. The optimization problem of system load balancing and its solution for industrial Internet-of-Things data management. Sci Sin Inform, 2024, 54(10): 2343-2367, doi: 10.1360/SSI-2023-0211
基于上下文增强的多级注意力会话推荐模型
曾碧卿, 池俊龙, 陈嘉涛, 谢梁琦
中国科学: 信息科学, 2024, 54(9): 2116-2135
摘要 会话推荐的目标是仅根据用户在匿名会话中有限的交互行为,来预测用户的下一次点击行为.最近几年,许多基于图神经网络的会话推荐方法取得了可喜的结果.然而,这些方法仍然存在不足之处.一方面,基于图神经网络的方法只考虑物品之间的转换模式,忽略了会话中的序列模式.另一方面,现有的大多数方法都只关注当前会话内部的信息,忽略了来自邻居会话的外部协作信息,即上下文模式.为了解决上述问题,本文提出了一种新颖的基于上下文增强的多级注意力会话推荐模型(CEMA),通过多级注意力机制分别在物品级和会话级这两个粒度上学习物品特征和建模用户偏好,以增强模型的个性化推荐能力. CEMA模型利用多层GraphSAGE来学习物品之间复杂的转换模式,以捕获用户的局部偏好.特别地,在CEMA模型中设计了一种物品级注意力机制,通过门控注意力单元计算会话中不同物品的重要性,以识别用户真正感兴趣的物品,避免噪声物品的干扰.这有助于准确地捕获会话的序列模式,以建模用户的全局偏好.此外,所提出的方法还设计了一种会话级注意力机制,通过简单的软注意力高效地计算不同会话之间的相似度,以聚焦于那些与当前会话最相似的邻居会话,并从中提取上下文模式,以帮助预测用户的下一次点击.本文在3个公开的基准数据集上进行了一系列实验,实验结果表明CEMA的推荐性能超过了现有最好的方法,充分验证了CEMA的有效性和优越性.
关键词 会话推荐; 多级注意力机制; 图神经网络; 序列模式; 上下文模式; session-based recommendation; multi-level attention mechanism; graph neural network; sequential patterns; contextual patterns
Biqing ZENG, Junlong CHI, Jiatao CHEN, et al. Context enhanced multi-level attention model for session-based recommendation. Sci Sin Inform, 2024, 54(9): 2116-2135, doi: 10.1360/SSI-2023-0104
基于时空正则化流的动态链路预测
尹彦婷, 吴雅婧, 杨雪冰, 张文生, 袁晓洁
中国科学: 信息科学, 2024, 54(7): 1692-1708
摘要 动态图作为图的一个重要分支,对节点间关系的动态变化过程具有良好的表达能力.利用动态图对实际关系网络进行建模,并动态预测未来时刻节点间的链路关系成为当前研究热点.然而,由于弱关系现象的存在,加权网络中的动态链路预测面临着重大挑战.针对这一问题,本文提出了一种基于正则化流的方法 DynWFlow (dynamic weight flow).该方法能够从生成角度出发,自适应地评价节点间链路信息的重要性,从而精准地进行链路特征的抽取,有效地解决了动态链路预测问题.特别地,对于弱关系情况,提出利用邻居节点集权重的相似程度来评估不同链接关系的重要程度,实现对节点间隐含关系的进一步捕获.在多个领域大量真实数据的实验结果表明,所提出的基于正则化流的动态链路预测方法 DynWFlow的性能明显优于其他预测算法.
关键词 动态链路预测; 正则化流; 动态图; 时空表示; 图嵌入; dynamic link prediction; normalizing flow; dynamic graphs; spatial-temporal representation; graph embedding
Yanting YIN, Yajing WU, Xuebing YANG, et al. Temporal link prediction on dynamic graphs based on spatial-temporal normalizing flow. Sci Sin Inform, 2024, 54(7): 1692-1708, doi: 10.1360/SSI-2022-0460