小程序开发资讯 直击国产AI芯片活命近况:GPU造血,TPU突袭,Chiplet成大势,相聚卡脖子

你的位置:拍卖小程序开发 > 联系我们 > 小程序开发资讯 直击国产AI芯片活命近况:GPU造血,TPU突袭,Chiplet成大势,相聚卡脖子
小程序开发资讯 直击国产AI芯片活命近况:GPU造血,TPU突袭,Chiplet成大势,相聚卡脖子
发布日期:2024-09-22 07:50    点击次数:159

作家 | GACS

芯东西9月6日报说念,一年一度的民众AI芯片峰会(GACS 2024)当天在北京火爆开幕。现场济济一堂,云直播全网不雅看东说念主数达到120万东说念主次。

▲会场内和场外展台东说念主潮涌动

大会由智一科技旗下芯东西结伙智猩猩发起主理,以「智算纪元 共筑芯路」为主题,邀请50+位嘉宾来自AI芯片、Chiplet、RISC-V、智算集群、AI Infra等范畴的嘉宾与会作干货共享。

恰好国产GPGPU独角兽壁仞科技竖立五周年,会上,壁仞科技晓谕获得多芯混训中枢时刻突破,打造出异构GPU协同教授有打算HGCT,业界初度大约赞助3种及以上异构GPU教授归拢个大模子。

▲壁仞科技推放洋产异构GPU协同教授有打算HGCT

智一科技结伙创举东说念主、CEO龚伦常行动主理方发表致辞,本年是民众AI芯片峰会举办的第七年,峰会已成为国内在该范畴里最有影响力的行业会议,是了解国表里AI芯片发展动态的病笃窗口。

▲智一科技结伙创举东说念主、CEO龚伦常

民众AI芯片峰会为期两日,主会场包括开幕式和三大专场(AI芯片架构、数据中心AI芯片、旯旮端AI芯片),分会场包括Chiplet时刻论坛、智算集群时刻论坛和RISC-V改换论坛。

在开幕式上,清华大学教化、集成电路学院副院长尹首一以《高算力芯片发展旅途探讨:从计议架构到集成架构》为题进行主题阐述,系统性复盘了高算力芯片存在的时刻挑战,并全面分析五条改换时刻旅途:数据流芯片、存算一体芯片、可重构芯片、三维集成芯片、晶圆级芯片。

当天有21位来自顶尖高校及科研院所、AI芯片企业的行家、创业者及高管进行共享。其中,高端对话方法邀请了三家AI芯片创企代表心思交辩,差别是国产大算力芯片独角兽壁仞科技、端侧与旯旮侧AI芯片独角兽爱芯元智,还有一家仅创立半年的年青AI芯片创企凌川科技。他们聚合探讨了AI芯片产业近况、最新推论与进阶方针。

一、破解大模子算力供需挑战,架构改换解围性能瓶颈

清华大学教化、集成电路学院副院长尹首一解读了大模子期间算力供需间的清苦:芯片工艺濒临Scaling-down极限,以致工艺红利带来的算力提高难以为继;系统濒临Scaling-out瓶颈,通讯带宽不及导致系统性能亏空。

破解这两浩劫题的契机在于算力芯片计议架构和集成架构的结伙改换:计议架构改换使每个晶体管齐被充分欺诈、发达更强算力;集成架构改换使芯片限度大约突破极限。

面前高算力芯片发展有五条新时刻旅途:数据流芯片、可重构芯片、存算一体芯片、三维集成芯片、晶圆级芯片。这些旅途齐不十足依赖于起先进的制造工艺,有助于为国内芯片产业开辟算力提高新空间。

▲清华大学教化、集成电路学院副院长尹首一

AMD在端到端的AI基础设施范畴打造了全面的产物线,消散从数据中心作事器、AI PC到智能镶嵌式和旯旮开拓,并提供跳跃的AI开源软件及洞开的生态系统。AMD基于先进ZEN4架构想象的CPU处理器平台、基于CDNA3架构面向AI推理&教授的MI系列加速器,已被微软等巨头选择。

据AMD东说念主工智能业绩部高等总监王宏强共享,AMD还在鼓励数据中心高性能相聚基础设施(UALink,Ultra Ethernet),这对AI相聚会构需要赞助快速切换和极低延伸、推广AI数据中心肠能至关病笃。

AMD行将发布下一代高性能AI PC,其基于第二代XDNA架构的Ryzen AI NPU,可提供50TOPS算力,将能效比提高至通用架构的35倍。在AI PC对秘密、安全和数据自主性的鼓励下,病笃的AI职责负载开动部署在PC上。行动民众跳跃的AI基础设施提供商之一,AMD讲理联袂强大客户与开发者共建变革性畴昔。

▲AMD东说念主工智能业绩部高等总监王宏强

自2015年以来,高通一直在把柄AI应用用例的变化,继续矫正NPU硬件想象。以第三代骁龙8为代表,高通AI引擎选择集成CPU、GPU、NPU等多种处理器的异构计议架构。其中,高通Hexagon NPU通过大片上内存、加速器专用电源、微架构升级等想象来优化性能和能效。AI的用例丰富,算力条款不一,因此异构计议和处理器集成的需求会经久存在,这也将带来峰值性能、能效、资本等方面的一系列提高。

高通的产物线消散手机、PC、XR、汽车、IoT等丰富的旯旮侧应用场景,大约赞助开发者在不同产物形态中欺诈高通的AI软硬件措置有打算进行算法加速,为破钞者带来丰富的末端侧AI体验和用例。临了,高通AI产物时刻中国区负责东说念主万卫星还预报,搭载最新的高通Oryon CPU的下一代骁龙出动平台,行将在本年10月21-23日举行的骁龙峰会上发布。

▲高通AI产物时刻中国区负责东说念主万卫星

苹芯科技结伙创举东说念主兼CEO杨越拆解了存算一体时刻的进阶过程。产业界主流芯片的出现和成长与当下计议需求的特色缜密相关,2015年前后,计议体捆绑构中的计议瓶颈从处理器端向存储端迁徙,尤其是神经相聚的出现,加速了AI芯片计议效力的提高节拍,存算时刻因此受到温柔。

杨越觉得,在大模子期间,存算一体时刻的契机是大约在出奇据存储的方位齐加入计议。跟着软件继续发展,基于存算的端侧芯片本年照旧冉冉闇练。畴昔,在云表措置数据带宽瓶颈,或将成为存算芯片下一个杀手级应用。

▲苹芯科技结伙创举东说念主兼CEO杨越

北极雄芯CTO谭展宏谈说念,在高性能计议范畴,作事器想象有两种不同的范式:方法作事器形态和定制作事器架构。在方法作事器形态下,北极雄芯温柔于在方法不竭的面积下,通过合乎的芯粒拆分与封装有打算,已毕更高的性价比;在非方法作事器形态下,提供了晶圆级集成的契机,温柔于芯片与系统想象一体化,对作事器与芯片进行协同想象,旨在达到“作事器即芯片”的目的。

颠倒地,谭展宏强调了不同芯片的想象有不同的带宽需求,举例在7nm以上工艺下,结合部署通讯优化,频频不需要很高的互连带宽密度,因此先进封装并不是必需的,基于2D的封装即可称心肠能需求并已毕高性价比有打算。北极雄芯基于《芯粒互团结口方法》的PB-Link IP,慎重已毕了低封装资本的互连已毕,当今已开动对外授权。

▲北极雄芯CTO谭展宏

二、高端对话:国产AI芯片造血智商增强,最年青创企产物已落地快手

智一科技结伙创举东说念主、总裁剪张国仁,与壁仞科技副总裁兼AI软件首席架构师丁云帆,凌川科技结伙创举东说念主、副总裁刘理,爱芯元智结伙创举东说念主、副总裁刘建伟,张开了一场以“国产AI芯片落地的共鸣、共创与共赢”为主题的圆桌对话。

张国仁在圆桌对话开动时称,由智东西、芯东西、智猩猩发起举办六届的AI芯片峰会,是国内该范畴持续时辰最长的专科会议,这几年见证了AI芯片和大模子的茁壮发展,也见证了一批国内造芯“新势力”的崛起。

▲智一科技结伙创举东说念主、总裁剪张国仁

丁云帆谈说念,大算力芯片是时刻密集、东说念主才密集、资金密集的行业。行动商场中已公开融资限度最大的芯片独角兽,壁仞科技领有顶级东说念主才,第一代产物已量产落地,多个国产GPU千卡集群照旧落地,能独处造血。但国产芯片行业合座情况仍然不易,生态方面和国外仍有差距。

好多国产AI芯片照旧开动落地于数据中心、智算中心。在丁云帆看来,英伟达面向国内的产物质价比并不高,国产芯片只好能作念出性能、作念出性价比,就会有商场。当今国内芯片产业落地音问越来越多、造血智商增强,与英伟达之间的差距会渐渐削弱。

▲壁仞科技副总裁兼AI软件首席架构师丁云帆

刘建伟觉得,低资本是很病笃的部分,企业最终如故要算账,企业对基础设施的投资一定要赚回顾。刘理敬佩后期在具身智能、智能视频等细分赛说念,更多企业的参预,将带来比通用产物更高的价值,会压缩英伟达的营收和利润。

app

凌川科技是最年青的国内AI芯片创企之一,本年3月刚竖立,已完成一轮融资,当今在售的智能视频处理芯片已落地快手,占快手视频处理范畴用量的99%,大算力推理芯片意象来岁头流片。

在刘理看来,距离AI芯片商场窗口关闭还很远,面对巨头在资源、资金、生态上的上风,创企需要在垂直、细分范畴发力。凌川科技将智能视频处理、AI推理算力结合,目的是将其每Token推理资本降到英伟达H800的10%。

▲凌川科技结伙创举东说念主、副总裁刘理

面向端侧、旯旮侧的爱芯元智,市占率均获得了可贵的获利。刘建伟觉得这两个范畴已毕交易闭环的速率会更快。他补充说,作念AI芯片最终一定会获利,但本色盈利的时辰表会受到AI部署资本等身分的影响,企业应尽快已毕自我造血和闭环。畴昔,爱芯元智将在端侧和旯旮侧大模子落地场景进行探索。

爱芯元智在汽车范畴的产物出货量终点可不雅,刘建伟谈说念,这是因为聪惠城市和汽车的底层芯斯须刻相似,爱芯元智在聪惠城市上积存了闇练时刻再参预智能驾驶不错较快已毕量产。同期,汽车范畴价钱战将鼓励产业单干是机遇期。

▲爱芯元智结伙创举东说念主、副总裁刘建伟

关于国产AI芯片若何快速找到生态位,刘建伟以爱芯元智的深耕场景为例,聪惠城市基本莫得国外公司,在智能驾驶范畴英伟达开拓0到1阶段,1到100更温柔资本的阶段即是国内企业的契机。丁云帆提到四个要素:褂讪可靠的供应保险、性价比、针对客户需求提供高效赞助作事、高效易用。刘理觉得应该在垂直范畴深耕,作念出比通用芯片更高效、优化的措置有打算。

瞻望畴昔,小程序开发资讯刘建伟预测畴昔4-5年,端侧和云侧齐将出现很大的发展机遇,产业界落地资本凭空后,数据不错已毕更大的价值。刘理觉得跟着AI应用迎来爆发期,云侧将产生多半推理需求。丁云帆谈到国内的高端算力仍然稀缺,但产业链的协同不错已毕稳妥的发展。

三、智算中心建造潮起:壁仞GPU新突破,国产TPU拼落地,Chiplet赢麻了

鄙人午举行的数据中心AI芯片专场,Habana中国区负责东说念主于明扬谈说念,近三年有大致50+政府主导的智算中心陆续建成、60+在打算和建造中,智算中心建造渐渐从一线城市向二三线城市下千里,从政府主导渐渐转向企业主导,对资本压缩、投资陈说周期的条款也渐渐提高。

据他不雅察,面前大模子开发日趋闇练,推理需求持续增长,头部CSP自研推理芯片的增速将提高,畴昔推理侧可能训导出多家异构芯片企业。

国外大模子教授需求仍将鼎沸,国内模子教授对算力的需求基本填塞,主要来自微调业务。要赞助畴昔AI发展,Chiplet、高速大容量内存、独有/通用高速互联时刻的和洽将起关节作用。

▲Habana中国区负责东说念主于明扬

为了冲破大模子异构算力孤岛难题,壁仞科技副总裁兼AI软件首席架构师丁云帆晓谕推出壁仞自主原创的异构GPU协同教授有打算HGCT。这是业界初度已毕赞助3种及以上异构GPU协同教授归拢个大模子,即赞助用「英伟达+壁仞+其他品牌GPU」混训,通讯效力大于98%,端到端教授效力达到90~95%。

壁仞正在结伙客户、协调伙伴等共同鼓励异构GPU协同教授生态,包括中国电信、中兴通讯、商汤科技、国网智研院、上海智能算力科技有限公司、上海东说念主工智能执行室、中国信通院等。

其产物已在多个千卡GPU集群开动商用落地。壁仞研发了软硬一体、全栈优化、异构协同、开源洞开的大模子合座措置有打算。壁仞初度已毕大模子3D并行任务自动掸性扩缩容,保持集群欺诈率近100%;已已毕千卡集群千亿参数模子10分钟自动归附、4天无故障、15天不中断的成果。

▲壁仞科技副总裁兼AI软件首席架构师丁云帆

中昊芯英结伙创举东说念主、CTO郑瀚寻谈说念,如今的AI大模子远超计议历史任一时刻的计议复杂度和算力需求量,需要更擅长AI计议的专用芯片。相较于GPU领先主要想象用于及时渲染和图像处理,TPU的想象则主要用于机器学习、深度学习模子和神经相聚计议,针对张量运算进行了高度优化,单个的脉动阵列架构蒙眬量和处理效力相较GPU有了更大提高。

中昊芯英自研的“一瞬”芯片是中国首枚已量产的高性能TPU架构AI芯片,详尽测算算力性能、资本、能耗后,单元算力资本仅为国际跳跃GPU的50%。郑瀚寻觉得,大模子发展后期,千卡、万卡集群的最好费效比将至关病笃,一瞬芯片多达1024片芯片间的平直高速互联,在构建大限度计议集群时的系统集群性性能可远超传统GPU数倍。

▲中昊芯英结伙创举东说念主、CTO郑瀚寻

据海浪信息洞开加速计议产物负责东说念主Stephen Feng共享,跟着大模子参数限度增多,生成式AI的发展濒临四大挑战:集群推广性不及、芯片功耗高、集群部署难、系统可靠性低四大挑战。海浪信息永恒宝石以应用为导向,以系统为中枢,通过开元洞开的系统引发生成式 AI 改换活力。

1. 浦项铁人俱乐部成立于1973年,球队历史曾获得5次韩K联赛冠军,4次韩国杯冠军,2次韩国联赛杯冠军,1次亚冠联赛冠军,以及在96/97/和97/98连续获得亚冠前身亚洲俱乐部锦标赛冠军等诸多赛事荣誉。

1. 全北现代成立于1994年,共计9次赢得K联赛冠军,5次捧起韩足总杯,2次称雄亚冠。

在硬件洞开方面,通过建立OAM(洞开加速模块)法式,加速先进算力的上线部署,赞助大模子及AI应用的迭代加速。在软件洞开方面,通过大模子开发平台“元脑企智”EPAI ,为企业打造全历程应用开发赞助平台,通过端到端的措置有打算,措置基础大模子落地到范畴存在的幻觉问题,措置应用开发历程复杂、门槛高,多元多模适配难、资本高等落地难题,加速企业大模子应用改换与落地。

▲海浪信息洞开加速计议产物负责东说念主Stephen Feng

清程极智竖立于2023年,聚焦AI Infra赛说念,团队孵化于清华大学计议机系,在智能算力优化方面,照旧积存了十几年的素质。

清程极智结伙创举东说念主师天麾共享说念,国产高性能算力系统正濒临着故障归附难、性能亚健康等方面的挑战,需要10大中枢基础软件系统配合,清程极智已在其中过半数范畴领有自研产物。

当今,清程极智已掌抓了从底层编译器到表层并行计议系统的全栈时刻积存,已毕大模子行业生态的全栈式消散,完成多个在国产芯片的高蒙眬量推理优化和主流大模子的快速移植和优化,计议成果提高彰着。其中,面向超大限度国产算力集群研制的大模子教授系统“八卦炉”,可推广到全机10万台作事器限度,用于教授174万亿参数目的模子。

▲清程极智结伙创举东说念主师天麾

芯和半导体时刻商场总监黄晓波谈说念,算力需求曩昔20年增长6万倍,畴昔10年可能达10万倍,存储、互联带宽成为主要发展瓶颈。Chiplet集成系统成为后摩尔期间先进工艺制程戒指和高性能算力提高突破的病笃方针,照旧庸碌应用于AI大算力芯片和AI算力集群相聚交换芯片。

对此,芯和半导体为Chiplet集成系统的想象开发提供了一站式多物理场仿真EDA平台。该平台赞助主流工艺想象互连结构参数化建模,求解仿真智商比其他平台快10倍,内存仅占1/20,并内置HBM/UCIe左券分析以提高仿真效力,获国表里多家头部AI算力芯片想象厂商使用,匡助大算力Chiplet集成系统产物的加速落地。

▲芯和半导体时刻商场总监黄晓波

在大模子教授过程中,相聚基础设施的支拨占比达到30%,突显了相聚性能的病笃性。据奇异摩尔结伙创举东说念主、产物及措置有打算副总裁祝俊东共享,相聚已成为智算性能瓶颈,构建AI相聚需要三网和洽,即集群网间互连、机柜内互连,芯片内的互联。

大智算集群需要高性能互连,Modernize RDMA与Chiplet成为关节时刻。为了优化RDMA,奇异摩尔的NDSA相聚加速芯粒系列基于可编程众核流式架构,通过高性能的数据引擎,已毕高性能数据流及生动数据加速。奇异摩尔开创的GPU Link Chiplet “NDSA-G2G”,基于以太基础设施 ,通过高性能数据引擎和D2D接口时刻,可已毕Scale-Up相聚TB级高带宽,性能忘形民众互连时刻的标杆。

▲奇异摩尔结伙创举东说念主、产物及措置有打算副总裁祝俊东

Alphawave是一家针对HPC、AI和高速相聚应用提供IP、Chiplet和ASIC想象措置有打算的企业。其亚太地区高等业务总监郭大玮共享说,针对数据在传输过程中濒临的问题,Alphawave IP产物的误码率比竞品低2个数目级,还可辅助进行集成和考证,并与Arm生态深度和洽。他们还能为客户的SoC提供全生命周期的赞助。

Chiplet方面,Alphawave匡助客户裁汰周期,凭空资本,提高了良率和迭代速率,当今已作念出行业内第一款多左券IO连续Chiplet,本年照旧流片。定制芯片方面,Alphawave主要专注于7nm以下的工艺,可把柄客户需求完成从规格到流片的全历程,当今已已毕超375次得手流片,DPPM小于25。

▲Alphawave亚太地区高等业务总监郭大玮

结语:下贱智能化风起潮涌,AI芯片迎历史机遇

在迈向通用东说念主工智能终极议题的说念路上,AI算法的形态继续变化,AI芯片也与之相随。当陈腐的沙砾相见畴昔的机器智能,时刻与工程聪惠和洽碰撞,一颗颗凝集了精微想象的AI芯片走进计议集群,步入千门万户,托载起硅基生命的进化。

从智算中心、智能驾驶到AI PC、AI手机、新式AI硬件,下贱智能化风潮为锚定不同场景的AI芯片齐带来了新一波历史机遇。快速发展的生成式AI算法及应用继续解锁新的算力挑战。时刻改换和商场需求正双重鼓励AI芯片商场限度扩大,并鼓励AI芯片的竞争格式趋于多元。

9月7日小程序开发资讯,2024民众AI芯片峰会将连接密集运送干货:主会场将举行AI芯片架构改换专场、旯旮/端侧AI芯片专场,公布「2024中国智算集群措置有打算企业TOP 20」、「2024中国AI芯片新锐企业TOP 10」两大榜单;分会场将举行智算集群时刻论坛、中国RISC-V计议芯片改换论坛。