计算机 其他 编者按 Website Google Scholar PDF

先进计算与新兴软件专题

前言

金海
中国科学: 信息科学, 2025, 55(3): 449-451
引用格式 金海. 前言. 中国科学: 信息科学, 2025, 55(3): 449-451, doi: 10.1360/SSI-2025-0096

计算机 高性能计算 论文 Website Google Scholar PDF

先进计算与新兴软件专题

数据流芯片的发展现状、趋势与挑战

冷静文, 过敏意, 曾德泽, 蒋文斌, 叶笑春, 陈华曦, 李文明
中国科学: 信息科学, 2025, 55(3): 452-463

摘要 本文聚焦于新型数据流架构在多领域融合计算中的应用潜力与发展趋势.随着人工智能、图计算和大数据等新兴技术的发展,传统冯·诺依曼(von Neumann)架构和领域专用架构的性能瓶颈愈加显著,难以满足未来计算系统对高性能和高灵活性的需求.本文首先梳理了现有数据流芯片的设计方法,基于专用性与通用性、执行粒度等维度探讨了数据流架构的不同实现方式及其应用现状.在此基础上,提出了一种基于并发代码块的数据流抽象机模型,并设计了完整的指令集和微体系结构,进一步实现了跨领域的统一中间表示和多种算子融合策略,优化了数据流在图神经网络、大模型计算和实时信号处理等任务中的执行效率.实验结果表明,基于该抽象机模型的处理器在性能与功耗方面优于现有的通用处理器架构.最终,本文展望了数据流架构在未来计算系统中的广泛应用前景及其对高效能计算的深远影响.

关键词 多领域融合计算; 数据流架构; 抽象机模型; multi-domain integrated computing; dataflow architecture; abstract machine model

引用格式 冷静文, 过敏意, 曾德泽, 等. 数据流芯片的发展现状、趋势与挑战. 中国科学: 信息科学, 2025, 55(3): 452-463, doi: 10.1360/SSI-2024-0343
Jingwen LENG, Minyi GUO, Deze ZENG, et al. Dataflow microprocessor: development, trends, and challenges. Sci Sin Inform, 2025, 55(3): 452-463, doi: 10.1360/SSI-2024-0343

计算机 高性能计算 论文 Website Google Scholar PDF

先进计算与新兴软件专题

人机物融合泛在应用的系统支撑

曹云帆, 赵超懿, 刘瀚之, 王加益, 王慧妍, 余萍, 曹春, 许畅, 马晓星, 蒋炎岩
中国科学: 信息科学, 2025, 55(3): 464-480

摘要 泛在计算为人机物融合应用带来了新的可能性,但也面临着异构资源管理、需求多样性和计算资源受限等问题;同时,人工智能模型的快速发展也为智能应用的开发带来了机遇与挑战.为此,本文提出了元级化软件定义的泛在操作系统设计理念,通过引入“软件孪生”技术实现对异构资源的抽象管理,采用“上传下达”的层级结构应对复杂需求的分解,并通过智能原生设计实现对人工智能模型的支持.本文进一步以操作系统智能助手、“天网”监控系统和疾病防控系统3个典型泛在计算应用场景为例,阐述了本文所提出的泛在操作系统设计理念在实践中的优势和潜在价值,预示着智能时代下人机物融合的广泛应用前景.

关键词 泛在计算; 泛在操作系统; 软件工程; ubiquitous computing; ubiquitous operating system; software engineering

引用格式 曹云帆, 赵超懿, 刘瀚之, 等. 人机物融合泛在应用的系统支撑. 中国科学: 信息科学, 2025, 55(3): 464-480, doi: 10.1360/SSI-2024-0338
Yunfan CAO, Chaoyi ZHAO, Hanzhi LIU, et al. System support for ubiquitous human-cyber-physical fusion applications. Sci Sin Inform, 2025, 55(3): 464-480, doi: 10.1360/SSI-2024-0338

计算机 高性能计算 论文 Website Google Scholar PDF

先进计算与新兴软件专题

面向服务器无感知计算的可定制函数调度

张信民, 李星儒, 樊浩, 黄卓, 吴松, 姚德中, 金海, 余辰
中国科学: 信息科学, 2025, 55(3): 481-499

摘要 服务器无感知计算凭借其弹性、高效和低成本的优势已成为下一代云计算的重要组成部分.随着服务器无感知应用的复杂度和多样性的增加,现有服务器无感知计算平台通常将不同应用的函数实例混合部署在统一服务器主机中,并使用统一的CPU调度策略(如Linux完全公平调度)进行调度.由于不同应用对性能、延迟以及调度公平性等的要求都不尽相同,使得单一的全局调度策略,难以满足多样化的调度需求.此外,实验发现,函数实例的执行时间跨度较大,短任务占比高,且冷启动对任务完成时间影响显著.这使得现有调度策略难以兼顾任务的效率与公平性,尤其会增加了短任务的调度延迟.为解决上述问题,我们提出并实现了一种调度隔离机制,允许在同一服务器上为单个或多个应用使用独立的CPU调度策略.此外,我们设计了FaaSchedule,一种新的可定制调度策略,综合考虑函数的执行时间、启动时间和等待时间,并支持根据不同应用需求动态定制调度策略.在OpenWhisk平台上的实验表明, FaaSchedule显著降低了短任务的平均完成时间,并有效支持调度隔离与策略定制.

关键词 CPU调度; 服务器无感知计算; 冷启动; 调度隔离; 定制化内核; CPU scheduling; serverless computing; cold start; scheduling isolation; customized kernel

引用格式 张信民, 李星儒, 樊浩, 等. 面向服务器无感知计算的可定制函数调度. 中国科学: 信息科学, 2025, 55(3): 481-499, doi: 10.1360/SSI-2024-0339
Xinmin ZHANG, Xingru LI, Hao FAN, et al. Customizable function scheduling for serverless computing. Sci Sin Inform, 2025, 55(3): 481-499, doi: 10.1360/SSI-2024-0339

计算机 高性能计算 论文 Website Google Scholar PDF

先进计算与新兴软件专题

面向自主计算的存算传融合架构及技术挑战

张珊, 李响, 李西烁, 王志远, 罗洪斌
中国科学: 信息科学, 2025, 55(3): 500-515

摘要 传统云或边缘计算模式下,数据的存储、计算和传输分离:终端负责指定具体的计算和关联存储节点,网络仅在这些节点间提供传输路径而并不感知所承载的计算任务.这种模式不仅导致海量异构存算平台难以感知识别彼此的可用资源并形成协同合力、数据存储与计算孤岛化现象严重,还面临拓扑时变、计算节点失效等不确定性导致的任务执行时间长甚至中断等挑战.为此,本文提出一种面向自主计算的存算传融合网络架构,通过构建耦合但差异化管理存算传多维资源的控制面,以及支持形式化计算任务路由和调度的数据面,赋能自主计算的全流程实现.基于所提架构,提出了多维资源状态探测、任务联合调度与服务协同部署方法,实现任务需求拟合与环境适变的高效自主计算.此外,本文还探讨了该架构下的挑战以及可能的未来研究方向.

关键词 自主计算; 存算传融合; 网络架构; automatic computing; caching-computing-communication integration; network architecture

引用格式 张珊, 李响, 李西烁, 等. 面向自主计算的存算传融合架构及技术挑战. 中国科学: 信息科学, 2025, 55(3): 500-515, doi: 10.1360/SSI-2024-0334
Shan ZHANG, Xiang LI, Xishuo LI, et al. Cache-computation-transmission integration for automatic computing: architecture and technology challenges. Sci Sin Inform, 2025, 55(3): 500-515, doi: 10.1360/SSI-2024-0334

计算机 高性能计算 论文 Website Google Scholar PDF

先进计算与新兴软件专题

云边融合安全存储架构及技术挑战

李经纬, 孙嘉, 杨劲远, 沈志荣, 杨浩淼, 方华, 陈厅, 张小松
中国科学: 信息科学, 2025, 55(3): 516-527

摘要 物联网的迅猛发展对数据管理提出了诸多挑战,为应对这些挑战并满足管理日益增长数据的切实需求,国家制订了“协同发展云计算与边缘计算”的远景规划.在此背景下,本文提出了一种云边融合安全存储架构,旨在探索物联网数据在云边融合场景下的有效管理途径.该架构利用机密计算、数据缩减、跨域同步等关键技术,支撑数据的高效管理和安全保障.在此基础上,本文进一步提出了一套适应于上述安全存储架构的系统核心设计方案,解决实施过程中的效率问题.此外,本文还探讨了该架构下的未来研究方向,以期为新场景下物联网数据管理提供新视角和解决思路.

关键词 云边融合; 数据缩减; 可信执行环境; 机密计算; 增量同步; cloud-edge integration; data reduction; trusted execution environment; confidential computing; delta synchronization

引用格式 李经纬, 孙嘉, 杨劲远, 等. 云边融合安全存储架构及技术挑战. 中国科学: 信息科学, 2025, 55(3): 516-527, doi: 10.1360/SSI-2024-0325
Jingwei LI, Jia SUN, Jingyuan YANG, et al. Cloud-edge integrated secure storage architecture and technical challenges. Sci Sin Inform, 2025, 55(3): 516-527, doi: 10.1360/SSI-2024-0325

计算机 高性能计算 论文 Website Google Scholar PDF

先进计算与新兴软件专题

云边协同下基于SGX的云数据安全去重方法

卜时磊, 谢雨来, 曹周, 王杰, 郑俊, 冯丹
中国科学: 信息科学, 2025, 55(3): 528-541

摘要 数据的不断增长对云的存储空间、安全、性能等的需求与日俱增.安全去重技术能够有效减少云存储空间需求的同时保障数据去重的安全性.然而,当前主流云安全去重方案依赖于可信第三方来进行密钥安全性保障,这引入了额外的信任假设和密钥管理开销.而两方的去重方案在安全和传输开销方面面临较大挑战.针对该问题,本文提出了一种基于英特尔软件防护扩展(Intel software guard extension, Intel SGX)的云数据安全去重方法,该方法的主要创新在于:(1)设计基于边缘端去重的云边协同安全体系架构,减少了云边之间的传输开销,使用SGX可信执行环境保障了云和边缘端数据和密钥的安全,无需不可信的第三方密钥服务器;(2)提出低开销的密钥安全生成协议,通过云边协同生成密钥,为每个边缘端用户生成唯一的加密密钥,而非为每个数据生成单独的密钥;(3)设计高效的基于标签流行度的标签查询机制.通过计算标签频率,实现冷热标签分离,在提高标签查询效率的同时避免标签误检.安全性理论证明和系统实验测试表明,本文的方案在安全性方面优于最新方法,并大大减少了密钥管理开销和标签查询开销,其中密钥存储开销可节省48.72%98.72%.

关键词 云边协同; 云存储; 安全去重; 英特尔软件防护扩展; 标签流行度; cloud-edge collaboration; cloud storage; secure deduplication; Intel SGX; tag popularity

引用格式 卜时磊, 谢雨来, 曹周, 等. 云边协同下基于SGX的云数据安全去重方法. 中国科学: 信息科学, 2025, 55(3): 528-541, doi: 10.1360/SSI-2024-0337
Shilei BU, Yulai XIE, Zhou CAO, et al. A secure cloud data deduplication method based on SGX under cloud-edge collaboration. Sci Sin Inform, 2025, 55(3): 528-541, doi: 10.1360/SSI-2024-0337

计算机 高性能计算 论文 Website Google Scholar PDF

先进计算与新兴软件专题

面向海量数据的高效流水化检索增强生成系统

余润杰, 阳羽凡, 周健, 吴非
中国科学: 信息科学, 2025, 55(3): 542-558

摘要 检索增强生成(retrieval-augmented generation, RAG)是一种通过诸如近似最近邻搜索(approximate nearest neighbor search, ANNS)等知识检索手段融入外部知识,从而显著提升大型语言模型(large language model, LLM)生成质量的方法.然而,随着外部知识库的不断膨胀, ANNS索引的存储需求也急剧增加,使得海量数据存储在内存中变得不切实际.这进一步促进了基于磁盘的ANNS的发展和应用,但也大大增加了RAG系统的响应时间.为解决这一问题,本文提出了PipeRAG,该系统通过流水线化执行基于磁盘的ANNS检索与LLM的预填充过程,有效地重叠了知识检索和模型推理的延迟,从而在确保检索精度的同时有效提升了RAG系统的整体性能.具体而言, PipeRAG设计了两个核心机制:“ANNS自适应预取机制”和“RAG动态流水线调度策略”,前者能够根据当前的检索状态实时调整预取速度,从而在性能与精度之间取得最佳平衡;后者则综合考虑了ANNS预取速度与LLM分块预填充的延迟,动态地调整预填充任务的大小,以实现最优的流水效率.在实际负载下的广泛评估显示, PipeRAG成功地将基于磁盘的ANNS的RAG系统的响应延迟缩短了25%~71%,同时保持了极低的召回率损失.

关键词 检索增强生成; 近似最近邻搜索; 大语言模型; retrieval-augmented generation; RAG; approximate nearest neighbor search; ANNS; large language model; LLM

引用格式 余润杰, 阳羽凡, 周健, 等. 面向海量数据的高效流水化检索增强生成系统. 中国科学: 信息科学, 2025, 55(3): 542-558, doi: 10.1360/SSI-2024-0331
Runjie YU, Yufan YANG, Jian ZHOU, et al. Efficient pipeline for retrieval-augmented generation system under big data. Sci Sin Inform, 2025, 55(3): 542-558, doi: 10.1360/SSI-2024-0331