爱游戏-BPO行业整合方案提供者
专业化、科技化、国际化;高标准、广覆盖、全流程
了解更多[导读]北京2024年7月2日 /美通社/ -- 6月28日,海潮信息"元脑中国行"全国巡展杭州站顺遂进行。会上,海潮信息重磅推出基在新一代散布式存储平台AS13000G7的AIGC存储解决方案。经由过程加持EPAI/AIStation的资本调剂能力、新一代散布式存储AS...
北京2024年7月2日 /美通社/ -- 6月28日,海潮信息 元脑中国行 全国巡展杭州站顺遂进行。会上,海潮信息重磅推出基在新一代散布式存储平台AS13000G7的AIGC存储解决方案。经由过程加持EPAI/AIStation的资本调剂能力、新一代散布式存储AS13000G7本身产物优势,新方案自在应对年夜模子利用对存储机能、容量和数据治理等方面的刻薄要求。同时,海潮信息测验考试性提出GPU计较集群算力与存储集群聚合带宽的保举配比,实现检测点数据60秒内写入和读取恢复,提高峻模子练习效力。
年夜模子时期,数据根本举措措施挑战进级
跟着数字经济的蓬勃成长,AI手艺正逐步成为鞭策企业营业变化和立异的主要动力,年夜模子已成为驱动数字经济深度立异、引领企业营业变化、加快构成新质出产力的主要动能。
会上,存储产物线副总司理刘希猛暗示,跟着年夜模子参数目和数据量的极速膨胀,多源异构数据的传、用、管、存,正在成为制约生成式AI落地的瓶颈之一,在AI年夜模子数据归集、练习、数据归档与治理等阶段,面对着数据归集时候长、模子练习效力低、数据治理复杂度高档针对数据根本举措措施的新挑战,用户亟需构建撑持多和谈、高带宽、低延迟、数据高效流转的年夜模子存储底座。
作为率先在业界提出散布式融会存储的厂商,海潮信息聚焦行业客户的年夜模子落地需求与焦点痛点,打造基在NVMe SSD高效适配和优化的散布式全闪存储AS13000G7-N系列。依托自研散布式文件系统构建了新一代数据加快引擎DataTurbo,在缓存优化、空间平衡、缩短GPU与存储读取路径等方面进行了周全进级,供给TB级带宽、万万级IOPS、EB容量,知足年夜模子存储在机能和容量方面的要求。
剑指AIGC主疆场,打造面向年夜模子利用的存储解决方案
在年夜模子数据处置全流程中,要想使练习效力到达极致,削减没必要要的资本华侈,算力和存力需要平衡设置装备摆设,练习阶段的数据读写机能成为阐扬存力最高文用的要害。而想要晋升存储效力、下降模子练习本钱,必需要在存储手艺长进行立异。对此,海潮信息推出基在AS13000G7的AIGC存储解决方案,该方案经由过程海潮信息AIStation人工智能平台进行智能资本调剂和深度数据治理,与EPAI 元脑企智 平台深度集成,数据在热、温、冷、冰四个存储资本池中高效活动,最年夜限度知足AIGC分歧阶段对高机能、易治理的存储需求。起首,经由过程与上层EPAI/AIStation的深度定制,依托智能数据预读和智能故障处置等手艺,为行业用户供给经验证的、更成熟的存储整体方案,今朝已累计办事AIGC用户超100家,此中百PB级用户超10家;其次,经由过程全局定名空间、多和谈及时互通、数据冷热分层等手艺实现横向数据自由活动,晋升存储效力和下降用户TCO 20%以上,方案加倍简约;最后,经由过程AS13000G7-N系列壮大的智能缓存优化、智能空间平衡和GPU纵贯存储等优势实现纵向数据高效拜候,缩短年夜模子练习时候50%,方案加倍高效。凭仗成熟的深度定制能力、出色的产物机能优势和数据全生命周期治理能力,海潮信息基在AS13000G7的AIGC存储解决方案充实知足年夜模子练习阶段高机能、归档阶段低本钱的存储需求。
算存黄金比例,加快年夜模子练习
倪光南院士曾提出, 对AI智能计较中间来讲,要想平衡设置装备摆设存力、算力和运力,必然要留意比例相当,不克不及掉调,才能获得最年夜的经济和社会效益。 为了最年夜限度阐扬年夜模子潜能,解决存算比例不服衡的困难,需要制订最好的存算比例,保障模子的高效练习。海潮信息最新发布的AIGC存储解决方案测验考试给出了模子练习时GPU算力与全闪存储机能、容量的设置装备摆设保举。
机能方面:年夜模子练习进程中检测点文件读写对存储系统读写机能带来庞大挑战。万亿模子需要12~13TB模子参数,写检测点需要花费年夜量的时候,未经优化的存储集群一次写入检测点需要3个小时。基在对存储集群读写带宽与年夜模子检测点恢复时候的阐发,为提高峻模子的练习效力,实现检测点数据60秒之内的写入和读取恢复,前端GPU计较集群算力(单元采取每秒万万亿次浮点预算PFLOPS)与存储集群聚合带宽(单元采取每秒千亿字节也就是常说的TB/s)的保举配比为35:1。固然,假如期望获得更低的CHK写入和恢复时候,可以继续增添集群带宽,但其收益率相对较低。
全闪容量方面:模子练习场景中,除初始加载的练习数据集要寄存在全闪池中,还进程练习中的CHK数据要保留。跟着万卡时期的到来,当呈现失落卡或练习中断现象,用户凡是会每隔一段时候就保留一次Check point数据,可以用来恢复练习或用在模子评估和推理。颠末一年多的实践,建议年夜模子用户2~4小时做一次Checkpoint,检测点数据保留两周时候,实现存储集群容量的公道操纵。经由过程模子阐发,连系产物特点,即可推算出全闪热存储池的存储设置装备摆设要求。固然,用户需求还会触及到用在搜集原始数据、预备原始数据的温存储池,用在归档的冷数据存储池。这些温冷池的容量一般在热存储池容量的10-20倍摆布,达百PB级。
元脑中国行 杭州站现场吸引了来自天目山尝试室、网易宓羲、英特尔等300余位专家学者、财产魁首、行业客户,现场环绕生成式人工智能、Al for Science、年夜模子的AIGC利用等行业热门话题进行分享。海潮信息还在会上进行了 EPAI种子打算 签约典礼,名都科技、启帆信息、图灵软件、天健远见等浙江区域的10位元脑火伴正式插手 EPAI种子打算 ,配合加快AI利用立异成长,鞭策年夜模子利用落地实践。
江南体育欲知详情,请下载word文档 下载文档7月1日动静,据媒体报导,苹果公司上月正式公布的Apple Intelligence将与OpenAI的ChatGPT告竣计谋合作,配合推动人工智能手艺的成长。
要害字: ChatGPT AI综合来看,现阶段以华为、百度为代表的中国企业其实不比Waymo、特斯拉差,中美的无人驾驶竞争仍会继续。放眼将来,中国需要在AI范畴快速追逐,避免美国企业操纵AI扩年夜优势。
要害字: 无人驾驶 AI6月25日,HKCERT公布全新“中国香港收集平安变乱调和中间”并进行启动仪式,新名称更能彰显HKCERT的办事主旨和规模,借以晋升中国香港各界,特殊是中小企和市平易近对HKCERT的熟悉。
要害字: AI 收集