理论计算机科学专题
Paw图-边删除问题的线性顶点核心化算法
盛子默, 肖鸣宇
中国科学: 信息科学, 2024, 54(7): 1604-1619
摘要 图边删除问题中一类重要问题是研究是否可以删除图中不超过k条边之后使得剩余的图不存在某个子图结构H,而子图H为顶点个数不超过4的连通图的情况被研究得最为广泛.本文主要考虑H为Paw图(三角形其中一个顶点再邻接一条边)的情况,称为Paw图–边删除问题,并为该问题设计了一个32k个顶点的问题核.这是该问题的第1个线性顶点大小的问题核.文中主要的技术是结合两个新的皇冠分解的变体来分析图的结构从而对图进行简化.
关键词 图算法; 核心化算法; H-边删除问题; Paw图-边删除问题; 皇冠分解技术; graph algorithms; kernelization; H-edge covering; Paw-edge covering; crown decomposition
Zimo SHENG, Mingyu XIAO. A linear vertex kernel for the Paw edge covering problem. Sci Sin Inform, 2024, 54(7): 1604-1619, doi: 10.1360/SSI-2023-0418
理论计算机科学专题
优先k-设施选址问题的近似算法
张震, 冯启龙, 徐雪松, 彭晗, 刘利枚, 石峰
中国科学: 信息科学, 2024, 54(7): 1588-1603
摘要 给定度量空间中的一个设施集合与一个带有最低服务级别要求的用户集合,优先k-设施选址问题的目标是开设最多k个设施,在每个开设设施上安置不同级别的服务,并将每个用户连接到一个能满足其服务级别要求的开设设施上,使得设施开设费用、服务安置费用与用户连接费用之和最小.本文利用拉格朗日(Lagrange)松弛技术求解优先k-设施选址问题,针对用户的服务级别要求提出了新的确定化舍入方法,并基于此给出了多项式时间的(7.9533+ε)-近似算法.这是关于该问题的第一个常数近似算法.
关键词 设施选址; 近似算法; 拉格朗日松弛; facility location; approximation algorithms; Lagrangian relaxation
Zhen ZHANG, Qilong FENG, Xuesong XU, et al. On approximation algorithms for the priority k-facility location problem. Sci Sin Inform, 2024, 54(7): 1588-1603, doi: 10.1360/SSI-2023-0407
理论计算机科学专题
面向LinUCB算法的数据投毒攻击方法
姜伟龙, 何琨
中国科学: 信息科学, 2024, 54(7): 1569-1587
摘要 LinUCB算法是求解上下文多臂老虎机问题的一种典型算法,被广泛应用于新闻投放、产品推荐、医疗资源分配等场景中.目前对该算法的安全性研究略显薄弱,这就要求研究者进一步加深对该算法的攻击方式的研究,以作出具有针对性乃至泛用性的防御措施.本文提出了两种通过添加虚假数据的方式对LinUCB算法进行离线数据投毒攻击的攻击方案,即TCA方案(target context attack)与OCA方案(optimized context attack).前者是基于训练数据与目标上下文的相似性来生成投毒数据的;后者是建模一个优化问题,通过求解该问题来构造投毒数据,是前者的优化版本.实验测试表明,仅需添加少量投毒数据作为攻击成本即可实现对攻击目标的100%攻击成功率.
关键词 上下文多臂老虎机; LinUCB 算法; 数据投毒攻击; 白盒攻击; 优化问题; contextual multi-armed bandit; LinUCB; data poisoning attack; white-box attack; optimization problem
Weilong JIANG, Kun HE. Data poisoning attacks on the LinUCB algorithm. Sci Sin Inform, 2024, 54(7): 1569-1587, doi: 10.1360/SSI-2023-0308
理论计算机科学专题
创作者经济中的去中心化审查机制设计
陈宏崟, 邓小铁, 孔雨晴, 陆宇暄
中国科学: 信息科学, 2022, 52(6): 992-1001
摘要 创作者经济的兴起以及相应去中心化平台的搭建加速了权力向个体创作者的转移,然而由于去中心化平台缺乏中心内容审查和监管,创作者可能滥用权力,传递可能造成社会损害的信息.已有的去中心化审查机制缺乏对创作内容社会损害的严谨刻画,同时对于该问题的解决方案也缺乏相应的理论支撑.我们提出了一套去中心化平台的审查机制:创作者上传的作品将首先由去中心化的审查者进行损害评估,根据评估结果,创作者在上传作品的同时需要支付一定押金,为了防止在随机环境下较坏情况发生,我们将引入去中心化的担保者进行担保,在此基础上通过中心化的资金池解决极端情形下的社会损害赔付.我们证明:(1)在损害评估阶段,审查者们诚实地给出自己对作品社会损害的评估是一个支配性策略;(2)审查机制以极高的概率保证作品的社会损害会低于担保者的赔偿上限和创作者的押金之和.
关键词 创作者经济; 互联网3.0; 去中心化审查; 区块链; 社交媒体; creator economy; Web3.0; decentralized censorship; blockchain; social media;
Hongyin CHEN, Xiaotie DENG, Yuqing KONG, et al. Decentralized content censorship for creator economy. Sci Sin Inform, 2022, 52(6): 992-1001, doi: 10.1360/SSI-2022-0126
理论计算机科学专题
基于区块链和贝叶斯博弈的联邦学习激励机制
张沁楠, 朱建明, 高胜, 熊泽辉, 丁庆洋, 朴桂荣
中国科学: 信息科学, 2022, 52(6): 971-991
摘要 联邦学习通过聚合多方本地模型成为数据共享的新模式.现有的联邦学习激励机制有效缓解了完全信息下的数据供给不足问题,但仍面临搭便车、不公平、不可信等挑战.为此,本文提出了一种基于区块链和贝叶斯博弈(Bayesian game)的不完全信息联邦学习激励机制,通过量化数据供给方的成本效用与数据需求方的支付报酬对数据交易过程建模,采用沙普利值(Shapley value)实现了数据供给方报酬分配的公平性.在交易模型中考虑到参与个体的异质性与隐私保护,将数据供给方的资源配置策略构建为不完全信息的贝叶斯博弈模型,通过优化本地模型训练策略实现对数据供给方的激励作用.本文进一步分析了激励机制的有效性与行动策略的可信性,提出一种隐私保护的贝叶斯博弈行动策略共识算法(privacy-preserving Bayesian game action strategy consensus algorithm, PPBG-AC),该算法使数据供给方在基于区块链的数据交易平台下实现了贝叶斯纳什均衡.方案对比与理论分析表明本文提出的不完全信息联邦学习激励机制保障了数据供给方利益分配的公平性与资源配置的可信性,基于实际公开数据集的仿真实验与性能评估验证了激励机制的有效性.
关键词 联邦学习; 激励机制; 区块链; 贝叶斯博弈; 沙普利值; 不完全信息; 隐私保护; federated learning; incentive mechanism; blockchain; Bayesian game; Shapley value; incomplete information; privacy protection;
Qinnan ZHANG, Jianming ZHU, Sheng GAO, et al. Incentive mechanism for federated learning based on blockchain and Bayesian game. Sci Sin Inform, 2022, 52(6): 971-991, doi: 10.1360/SSI-2022-0020
理论计算机科学专题
最小最大圈覆盖问题的精确算法
袁森, 陈开奇, 李江坤, 张鹏
中国科学: 信息科学, 2022, 52(6): 960-970
摘要 最小最大圈覆盖问题是旅行售货商问题的推广,该问题在无线传感器网络和无人机救灾等领域有着广泛的应用.目前关于最小最大圈覆盖问题的研究主要集中在近似算法方面,而缺少精确算法方面的结果.本文根据最小最大圈覆盖问题的组合特征,对该问题设计了基于动态规划策略的首个精确算法,时间复杂度为O~*(3~n).本文将对最小最大圈覆盖问题的求解分为两个阶段,第一个阶段是对问题的输入进行预处理,第二个阶段是在预处理的基础上求问题的最优解.有趣的是,两个阶段的方法都是基于动态规划策略设计的,这是本文处理最小最大圈覆盖问题的一个主要的特色.本文所证明的求到最优解的时间O~*(3~n),显著优于基于暴力搜索策略的枚举算法的时间.
关键词 最小最大圈覆盖问题; 动态规划; 分支定界; 精确算法; min-max cycle cover; dynamic programming; branch and bound; exact algorithm;
Sen YUAN, Kaiqi CHEN, Jiangkun LI, et al. Exact algorithms for the min-max cycle cover problem. Sci Sin Inform, 2022, 52(6): 960-970, doi: 10.1360/SSI-2021-0444
理论计算机科学专题
平面上带次模惩罚费用的最小能量部分覆盖问题
刘晓非, 代涵, 李思哲, 李伟东
中国科学: 信息科学, 2022, 52(6): 947-959
摘要 给定平面上的n个用户、m个传感器和一个正整数k (n),任意传感器s均可以通过提供能量p(s)产生一个圆形的覆盖区域,覆盖区域的半径r(s)与p(s)满足p(s)=r(s)~α,其中, α1为衰减系数.平面上带次模惩罚费用的最小能量部分覆盖问题尝试寻找传感器的一个能量供应方案,使得至少有k个用户被覆盖且总能量与未覆盖用户的惩罚费用之和达到最小,其中惩罚费用由一个次模函数确定.该问题推广了最小能量覆盖问题、最小能量部分覆盖问题和带惩罚费用的最小能量部分覆盖问题.通过深入挖掘平面上半不相交圆盘集合的几何性质,本文设计了一个基于原始对偶框架的两阶段多项式时间(5·2~α+1)-近似算法.当惩罚费用函数是线性函数时,此算法的近似比为5·2~α.
关键词 能量部分覆盖问题; 次模惩罚费用; 原始对偶方法; 半不相交; 近似算法; k-prize-collecting power cover problem; submodular penalties; primal-dual method; semi-disjoint; approximation algorithm;
Xiaofei LIU, Han DAI, Sizhe LI, et al. k-prize-collecting minimum power cover problem with submodular penalties on a plane. Sci Sin Inform, 2022, 52(6): 947-959, doi: 10.1360/SSI-2021-0445
理论计算机科学专题
无权重物品的几乎无忌妒分配
张智杰, 应东昊, 张家琳, 孙晓明
中国科学: 信息科学, 2022, 52(6): 935-946
摘要 公平分配研究如何把m个不可分的物品公平地分配给n个玩家.每个玩家关于物品有一个可加的估值函数.物品是无权重的,如果他们的取值范围为{1, 0,-1}.非负估值的物品称为奖品,非正估值的物品称为苦差.本文考虑寻找无权重物品的分配,并满足“相差任意物品下是无忌妒的”(envy-free up to any item, EFX0). EFX_0是本领域内最受关注的公平性度量.一般可加估值函数下的EFX_0分配的存在性仍然是开放的.本文提出寻找无权重物品的EFX_0分配的多项式时间算法.为了达到这个目的,本文分别提出了寻找无权重奖品和无权重苦差的EFX_0分配的算法.然后,通过将二者小心地结合起来,本文得到了最终的算法.本文的结果完整刻画了无权重情况下寻找EFX_0分配的解决方案.
关键词 公平分配; 无忌妒性; 不可分物品; 奖品; 苦差; fair allocation; envy-freeness; indivisible items; goods; chores;
Zhijie ZHANG, Donghao YING, Jialin ZHANG, et al. Almost envy-free allocations of unweighted items. Sci Sin Inform, 2022, 52(6): 935-946, doi: 10.1360/SSI-2021-0449
图数据中极大团枚举问题的求解: 研究现状与挑战
许绍显, 廖小飞, 邵志远, 华强胜, 金海
中国科学: 信息科学, 2022, 52(5): 784-803
摘要 随着大数据时代的到来,图数据挖掘成为了一个热门的研究方向.极大团枚举(maximal clique enumeration, MCE)作为图论中的一个基本问题,在很多领域都有着广泛的应用.然而,鉴于极大团枚举问题本身的复杂性以及现实图数据规模的飞速增长,在现实图数据上进行极大团枚举是很耗时的.目前已经有大量的工作对该问题的求解算法进行改进,或采用各种计算优化方法减少算法的运行时间.本文就极大团枚举问题做了如下工作:对现有的极大团枚举问题的研究工作进行了分类归纳;对极大团枚举问题的研究现状进行了详细介绍;对该问题进一步发展所面临的挑战和发展方向进行了讨论和展望.
关键词 极大团枚举; 图论; 图数据挖掘; 图划分; 并行计算; maximal clique enumeration; graph theory; graph mining; graph partition; parallel computing;
Shaoxian XU, Xiaofei LIAO, Zhiyuan SHAO, et al. Maximal clique enumeration problem on graphs: status and challenges. Sci Sin Inform, 2022, 52(5): 784-803, doi: 10.1360/SSI-2021-0155
分布式梅特罗波利斯算法: 收敛条件与最优并行加速
凤维明, 尹一通
中国科学: 信息科学, 2022, 52(2): 287-313
摘要 梅特罗波利斯算法(Metropolis algorithm)是一种基本的马尔可夫链蒙特卡罗(Markov chain Monte Carlo, MCMC)采样技术,可用于从概率图模型所表示的高维概率分布(即吉布斯(Gibbs)分布)中进行随机采样.传统的梅特罗波利斯算法是一个串行算法.关于其快速收敛性的一个经典结论是:当满足梅特罗波利斯算法的Dobrushin-Shlosman条件时,该算法在O(n log n)步内快速收敛,其中n是随机变量的个数.本文研究了梅特罗波利斯算法的分布式版本——局部梅特罗波利斯算法.对该算法的正确性与收敛速度进行了分析,证明了该算法总是收敛于正确的吉布斯分布;并且对于一类自然的不包含三角形(triangle-free)概率图模型,如果满足相同的Dobrushin-Shlosman条件,则局部梅特罗波利斯算法在O(log n)轮内快速收敛.相比于传统的串行算法,实现了?(n)倍的渐进最优并行加速比.具体应用包括图染色、硬核模型和伊辛(Ising)模型的分布式采样算法.
关键词 分布式采样; 马尔可夫链蒙特卡洛; 混合时间; 自旋系统; 耦合; distributed sampling; Markov chain Monte Carlo; mixing time; spin system; coupling;
Weiming FENG, Yitong YIN. Distributed Metropolis algorithm: convergence condition and optimal parallel speed-up. Sci Sin Inform, 2022, 52(2): 287-313, doi: 10.1360/SSI-2021-0127