云计算迎来“第三次浪潮”,你还不抓住机会吗?(云计算第三次技术革命)
随着人工智能、大模型技术的迅速发展,云计算迎来了一个新的时代——智能化时代,新时代的到来对底层的算力基础设施提出更高的要求。面对新的需求,阿里云持续投入,推出了通义千问大模型2.0和8大行业大模型,同时还对阿里云基础设施进行全面的技术升级和创新,致力于打造出的“AI时代最开放的云”,继续引领云计算行业的发展。
云计算第三次浪潮
针对此轮AIGC浪潮,黄仁勋等业内大佬纷纷抛出“AI的iPhone时刻、互联网时刻”等评价,那么如何评估GPT浪潮对云计算的影响?
阿里云创始人、中国工程院院士王坚博士认为,“2023年,人工智能与云计算在60年后自然地走在一起,是云计算的第三次浪潮”(自约翰·麦卡锡在1956年首次提出人工智能概念算起),前两次分别是互联网企业上云和传统企业上云。
2000年美国工程院评选的《二十世纪最伟大20项工程技术成就》榜单中,排在第一名的是电气化。可以说,电气化催生了其余19项成就的出现,包括无线电与电视、电话、家用电器、计算机、因特网等等。
王坚博士认为,云计算就像电,两者都是“你每分每秒都在用,但不会感觉到它的存在。”
如果将当前的人工智能革命类比100多年前的电气化革命,云计算与大模型的关系,就像电和电机的关系。
根据工信部数据,电机能耗约占整个工业能耗的65%以上,占全国总耗电的60%。未来,云计算大部分基础资源将被大模型消耗掉。
打造AI时代的云基础设施
大模型的训练是一个系统工程,它不止是涉及AI框架和模型,还涉及到底层的算力、网络、存储,只有强大的云计算体系才能训练出高质量的大模型。比如,大模型需要海量的训练数据,这不仅对存储提出更高的需求,同时,对数据的传输和时延也都有更严格的要求。另外,大模型通常需要长时间训练,一旦出错恢复起来费时费力,这就需要系统具有更高可靠性。
“阿里云很早就提出数据中心是一台计算机的理念,今天,AI时代更加需要这样的技术体系。我们要以云的方式,通过高效的网络连接、高效的并行计算为AI模型、为AI应用提供坚实的算力底层。”周靖人说。
为了保证大模型训练的稳定互联和高效并行计算,阿里云全面升级了人工智能平台PAI。据悉,PAI支持高达10万卡量级的集群可扩展规模,超大规模分布式训练加速比高达96%,远超业界水平;在大模型训练任务中,可节省超过50%算力资源。
阿里云通义大模型系列就是基于人工智能平台PAI训练而成。除了通义大模型,中国一半大模型公司跑在阿里云上,百川智能、智谱AI、零一万物、昆仑万维、vivo、复旦大学等大批头部企业及机构均在阿里云上训练大模型。
除了人工智能平台的优化和升级,阿里云还对云基础设施整体从性能、安全和智能三个维度进行全面升级。比如,阿里云推出了最高性能的第八代实例g8i,CPU级至第五代至强,性能提升20%以上,而且保持价格不变;阿里云还发布了多款HPC优化实例,性能可提升40%;OSS对象存储读取带宽也提升10倍至100 Gbps,有效加速大模型相关计算和数据分析;RDS数据库读写性能提升了102%等。
尤为值得一提的是,阿里云基于自研云原生CPU倚天710的服务器已经得到规模化部署。过去一年,阿里云持续完成了数十项软硬一体的全栈优化,倚天710主频已提升至3.0GHz,内存频率由4400提升到4800GHz,芯片性能更加强劲,同时芯片与CIPU协同,可提供更高性能和更低成本的算力服务。
免责声明:
1、本号不对发布的任何信息的可用性、准确性、时效性、有效性或完整性作出声明或保证,并在此声明不承担信息可能产生的任何责任、任何后果。
2、 本号非商业、非营利性,转载的内容并不代表赞同其观点和对其真实性负责,也无意构成任何其他引导。本号不对转载或发布的任何信息存在的不准确或错误,负任何直接或间接责任。
3、本号部分资料、素材、文字、图片等来源于互联网,所有转载都已经注明来源出处。如果您发现有侵犯您的知识产权以及个人合法权益的作品,请与我们取得联系,我们会及时修改或删除。