存力决定了数据能否存得下、是否安全、是否高效流动,为解决存算失衡、介质应用核心技术创新不足等诸多挑战,需尽快形成我国数据存储产业发展的顶层规划和具体目标、补链强链,建立存力自主标准,构建介质应用标准等,实现关键技术的自主可控。
曾勇
(资料图)
电子科技大学校长
ChatGPT又更新了。3月23日,据国外媒体报道,OpenAI推出了ChatGPT的插件功能,通过授予ChatGPT访问第三方知识源和数据库(包括网络)的权限来扩展ChatGPT的功能,比如通过加载某一插件,ChatGPT可以实时计算地球与木星之间的距离。此前数据显示,ChatGPT的总算力消耗约为3640PF-Days(即假如每秒计算1000万亿次,需要计算3640天),需要7—8个投资规模30亿、算力500P(50亿亿次)的数据中心才能支撑运行。而随着ChatGPT的不断更新,数据规模将会不断扩大。
近年来,随着人工智能量子计算、大模型、区块链等技术的飞速发展,互联网数据规模呈爆发式增长态势。根据国际数据公司(IDC)测算,到2025年中国生成的数据总量将会达到48.6ZB,全球占比为27.8%;对国内生产总值(GDP)增长的年均贡献率将会达到1.5%至1.8%。
无论是国家级的“东数西算”战略,还是渗入各个行业的数字技术,想要保障数据的可靠性,高效、安全的存储都是其中的关键一环。
随着中国数字经济进入深化应用、规范发展、普惠共享新阶段,数据要素成为数字经济深化发展的核心引擎,基于安全可靠、经济高效的新型存储平台存好、管好、用好数据要素,将为数字经济发展带来强劲动力。
存力决定数据是否高效流动
“数据是数字经济的核心生产要素和战略性物资,数据存储安全和自主可控是我国网络安全的基石。计算基础设施关系到国家安全与高质量发展。”电子科技大学校长曾勇说。
“十四五”规划纲要把增强数据的存储和运算能力作为加快建设新型基础设施,乃至建设现代化基础设施体系的重要内容;今年1月3日,工业和信息化部等十六部门联合发布了《关于促进数据安全产业发展的指导意见》,提出要加强核心技术攻关,研究大数据场景下轻量级安全传输存储等技术。
“我国现有的以中央处理器为中心的计算基础设施,面临算力、存力(存储介质)、网络等诸多问题和挑战,难以满足当前战略发展要求。因此,亟须构建存算协同、高速互联、盘芯协同、全栈自主可控的新型计算基础设施。”曾勇说。
曾勇强调,存力决定了数据能否存得下、是否安全、是否高效流动,为解决存算失衡,介质应用核心技术创新不足,软件、协议、部件等依赖国外等诸多问题,需尽快形成我国数据存储产业发展的顶层规划和具体目标、补链强链,建立存力自主标准,构建介质应用标准等,实现关键技术的自主可控。
新型架构向以“数据为中心”变革
运算速度越快的计算机系统,对中央处理器的性能要求越高。随着数据量爆炸式增长,受到工艺水平制约的中央处理器已无法满足因数据增长带来的处理需求。当前我国服务器中央处理器为处理网络及存储等请求,要消耗30%算力、增加20%时延,能耗高成本效率低,而且由于通用CPU并不擅长数据处理运算,导致其能效比低下。
曾勇指出,互联网底层技术的变化将加速推动从以“中央处理器为中心”架构向以“数据为中心”的新型架构变革,新架构通过极简互联的新型高效存储组件,彻底从底层微观层面上做到自主可控。
曾勇建议,应从规划引导、专项牵引、标准制定等三方面构建存算协同、高速互联、盘芯协同、全栈自主可控的新型计算基础设施。国家应推动构建介质应用标准,制定智能盘、智能框、存储控制/驱动器等国家标准、行业标准,并制定高通量互联协议标准,通过标准评价体系、符合性认证、对接测试等方式,实现关键技术、产品的有效评价和认定;与此同时,还应补链强链,对算力、存力按照独立的产业链或子链进行管理和发展,培养生态主导型链主企业,带动国内上下游产业链能力提升。