破解AI时代算力难题,中国看到了三个“关键”

字体大小:

自人类踏入工业社会以来,对某种资源的需求可能从未有过如此迅猛的增长。

有统计显示,在人工智能(AI)时代,对算力的需求每隔两个月就要翻倍。相关数据显示,到2030年,智能算力相比2020年将增长500倍。毫无疑问,随着以人工智能为代表的新一轮科技革命和产业变革突飞猛进,算力已成为数字经济时代重要且紧缺的战略资源。

为了将新的战略资源牢牢把握在自己手中,在全球新一轮科技与产业竞赛中获得发展的主动权,从政府到业界都认识到加强算力基础设施,特别是打造云化算力的重要性,也看到这一进程中的三个“关键”。

关键的时刻:算力成为智能时代的战略性资源

2023年12月14日,全球知名的科学期刊《自然》公布了2023年度十大科学人物榜单,ChatGPT因其给科学发展和进步带来的巨大改变而榜上有名。非人类跻身科学人物排行榜,这在《自然》杂志的历史上还是第一次,也证明了一个关键时刻的来临。

从ChatGPT到Sora,再到中国国内的“百模千态”,加快发展新一代人工智能技术成为各国赢得全球科技竞争主动权的重要战略抓手。而在百舸争流中抓住机遇、占得先机的关键就在于算力。

算力是人工智能时代的核心生产力,已经被各国提升至国家战略资源规划层面。对于中国而言,算力的紧缺和昂贵已成为人工智能创新的最大制约因素,尤其是大模型的飞速发展对算力提出了更巨大且迫切的要求。

随着国外芯片封锁的不断升级,自行购买硬件或服务器以获得算力不再是一种经济、安全、可靠的方式。在这种情况下,云化算力作为一种高效、灵活、可扩展的解决方案,正逐渐成为突破算力瓶颈的更优选择。

2022年,中国启动“东数西算”计划,拉开了建设全国一体化算力网的大幕。根据规划,“东数西算”将在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并设立10个国家数据中心集群。

“东数西算”的庞大计划既是通过一张“网”促进算力与数据的流动,同时也是基于中国能源供需分布做出的战略性布局。中国西部地区具有能源丰富、温度低等优势,有助于降低数据中心的能源消耗。

一些业内人士已经指出,算力的尽头就是能源。以美国为例,全国约2700个数据中心的电力消耗已经占据该国总电力的4%以上,为美国的电力供应带来了巨大压力。据美国媒体报道,ChatGPT目前每天要响应大约2亿个请求,消耗的电力超过50万度,相当于1.7万个美国家庭的用电量,一些领先的美国人工智能企业甚至考虑通过购买小型核电站获取充足能源。

相比之下,中国多元且充足的能源供应以及在光伏、风电等领域的产业领先地位,有能力以稳定、高效、绿色的方式推动大规模算力中心的建设,为中国在全球“算力竞赛”中增添底气。

关键的优势:各方携手突破发展瓶颈

两年多来,随着一系列政策出台落地,“东数西算”的国家枢纽节点建设取得阶段性成果。6月14日,“东数西算”十大数据集群之一的芜湖集群迎来重大进展——华为云华东(芜湖)数据中心(以下简称“芜湖数据中心”)正式开服。

根据规划,“东数西算”芜湖集群是长三角枢纽两大集群之一,同时也是中部六省唯一的算力集群。在政府、企业和科研机构的共同努力下,芜湖有望成为全国算力中心和智算中心的重要支撑,为长三角地区的数字经济发展和实体经济的深度融合提供强大支持。

华为云华东(芜湖)数据中心是芜湖集群节点的重要组成部分,其定位是华东区域算力高地,通过光纤网络,芜湖数据中心可直达华东和中部热点城市,网络时延在10ms以内,甚至很多城市在5ms以内,其中到南京仅需2.0ms,到合肥2.4ms,不仅能满足对时延不敏感的业务,也能满足对于时延要求非常高的业务(比如AI推理、电商、游戏)的诉求。

芜湖数据中心在建设中持续创新,在架构设计、绿色低碳、产品化标准化交付等方面具有明显优势。华为云通过设计全新多元算力对等池化架构,重新定义云基础设施,从算力规模、扩展模式、使用模式等方面匹配超大规模算力诉求。

在全新架构设计中,华为云秉承“一切可池化”“一切皆对等”“一切可组合”的核心理念,通过技术创新解决行业难题。

绿色低碳方面,芜湖数据中心直通风、液冷和云软件可以实时智能调节,创新技术使华东区域液冷机房年均PUE 1.1,目前业内PUE一般为1.25,远高行业水平,为华东区效能最优,每100万台服务器每年可以节省约10亿度。

在运维层面,华为云在芜湖数据中心首次引入IoT 技术,打造了全数字化的数据中心,实现了告警秒级上报,故障分钟级定位。以电池为例,华为云数据中心全网拥有百万级的电池,每天产生 20 亿的数据量。华为云通过持续的AI训练,积累了 400 多个特征模型库,将电池风险识别率提升到了 92%,准确率也提升到了 97%。

这些能力都是中国人工智能产业发展所需要的叠加之下,将推动中国在芯片遭遇封锁的情况下走出一条自己特色运化算力之路。

随着芜湖数据中心正式全球开服,华为云全国存算网云核心枢纽布局全面完成,贵州贵安、内蒙古乌兰察布以及安徽芜湖三大云核心枢纽构建起了算力一张网。三大云核心枢纽是华为最高规格、最大规模、最新技术的数据中心,服务全国算力和人工智能产业发展需求。

中国拥有发展好人工智能产业、站上“工业革命4.0”高地的一系列优势:全产业链体系和全球规模最大的制造业以及14多亿人口形成的巨大消费市场让人工智能有着无比广阔的市场空间;从积极响应“东数西算”规划的各地政府,到产业链上下游的企业目标一致,携手织就跨越东西、贯通南北的全国算力一张网以解决发展瓶颈;华为云等企业则站在队伍前列,依靠自身的创新基因与技术实力解决一道道曾经“卡脖子”的难题。

关键的参与者:助力迈向中国特色的道路

即使回顾人工智能发展的几十年历程,大模型的颠覆性与复杂性也是前所未有的:模型参数预计将在不久后超过万亿,数据集规模和Token长度也在迅速增长,这些挑战相互影响、环环相扣,更需要系统性创新。

对于人工智能产业以及以拥抱这一颠覆性技术的企业而言,提供算力只是整个链条的一环。展望“AI+”的智能化新时代,“云”与人工智能大模型创新应用就是“水与鱼”的关系,云也将成为各行各业数字化、智能化不可或缺的“基建”。

目前,华为云基于全栈自研技术,打造了即开即用的AI算力服务——昇腾AI云服务。华为公司常务董事、华为云CEO张平安近期曾这样讲过:“企业再也不需要高价抢购GPU,也不需要担心GPU未来潜在的供应连续性挑战。”

据悉,昇腾云为大模型和人工智能应用的开发、运行和运维提供云化算力底座,具备资源获取快、模型迁移快、故障恢复快和云上推理投资优、就近服务时延优、云上性能优等特点。目前,科大讯飞、网易伏羲、知乎、美图等科技大厂都选择了通过昇腾AI云服务获取澎湃算力。

此外,华为云还推出了面向行业的盘古大模型以及包括数据工程、模型开发和应用开发的一站式大模型工程套件。在气象行业,基于预训练的盘古气象大模型在单台服务器上只需要不到10秒钟,就可以对台风未来10天的路径给出精准预测,相较利用3000台服务器、花费4-5小时的计算效率有着大幅提升。

华为云曾多次公开表示,将致力于打造中国坚实的算力底座,做厚“黑土地”。当许多国家的人工智能发展依然需要依赖他人提供的基础设施之时,华为云正与更多中国科技企业一起走出具有中国特色的云化算力之路。

像戈壁滩上的胡杨一样“扎根到底”被看作是华为“基因”,解决“卡脖子”也在内外因素的影响下成为这家企业的使命:华为是5G与5.5G技术领域的全球领先企业之一;鸿蒙操作系统的生态设备数量超过8亿,原生应用超4000个,“纯血鸿蒙”也即将到来;在备受关注的新能源汽车领域,华为的智能驾驶解决方案引领了行业发展方向。

“核心技术是买不来、要不来的”,这句话已经被反复验证且被华为这样的中国科技企业深深牢记,中国在科技领域的创新与发展只有一个答案:自立自强。

来源:环球网