新闻资讯

你的位置:外围球赛软件 > 新闻资讯 > 开云kaiyun这个集群可以让它完成归拢个任务-外围球赛软件

开云kaiyun这个集群可以让它完成归拢个任务-外围球赛软件

发布日期:2025-04-08 06:44    点击次数:148
专题:2024中国汽车软件大会开云kaiyun 11月7日-8日,2024中国汽车软件大会在上海嘉定召开。百度智能云自动驾驶有策动大家徐征发扮演讲。 以下内容为现场发言实录: 尊敬的诸位指令、诸位客东说念主,亲爱的同仁们,寰球下昼好! 相等本旨能有这么一个契机和寰球沿路来分享百度智能云在汽车行业昔日一年来的一些探索和推论,百度行为国内最早布局智能云和自动驾驶的企业,咱们一直积极地向行业输落发具、时间和作事,股东汽车智能化的快速发展。在昔日一年中,在汽车智能化的大方进取咱们可以看到筹算最多的是大...

开云kaiyun这个集群可以让它完成归拢个任务-外围球赛软件

专题:2024中国汽车软件大会开云kaiyun

  11月7日-8日,2024中国汽车软件大会在上海嘉定召开。百度智能云自动驾驶有策动大家徐征发扮演讲。

  以下内容为现场发言实录:

  尊敬的诸位指令、诸位客东说念主,亲爱的同仁们,寰球下昼好!

  相等本旨能有这么一个契机和寰球沿路来分享百度智能云在汽车行业昔日一年来的一些探索和推论,百度行为国内最早布局智能云和自动驾驶的企业,咱们一直积极地向行业输落发具、时间和作事,股东汽车智能化的快速发展。在昔日一年中,在汽车智能化的大方进取咱们可以看到筹算最多的是大模子上车,第二个是端到端的自动驾驶,诚然到咫尺为止,端到端在量产车辆上数目还相等少,然而咱们可以细主义说端到端照旧被以为是个行业共鸣的自动驾驶的时间道路。在端到端研发,包括在分模块的算力、数据包括器用链齐发生了一些相比大的变化。在昔日一年百度亦然在积极探索和斥地,围绕端到端自动驾驶的这么一个基础平台。

  是以今天我念念给寰球分享的题目就叫作念《云智一体 助力自动驾驶时间的才能提高,开启自主可控的新范式》。底下咱们看一下,这个是从一个综合的角度来先容一下咱们百度智能云自动驾驶顾问有策动的一个全景框架。在底层的话其实是咱们的公有云、独到云、旯旮云,由它提供基础的这么一个云作事、传统的这种CPU云。然后在之上的话,因为针对自动驾驶这么一个AI算力需求,咱们有一个AI的大底座,这里进行AI狡计、存储、网罗、加速,包括AI的容器。

  然后在这个底座之上会有一个异构的狡计平台,这个异构狡计平台后头我会讲到它为什么相等弥留,而且在可料念念的将来应该是决定着在大模子这么一个AI算力上才能的上下。其实这个底下就像一个冰山相通,底下这一部分是埋在水下的,谈的相比少,其实这些是百度信得过花了很大的力气来打造的一个平台。之上的话是寰球战役相比多的,亦然指摘相比多的,和诸位这种智驾的尤其研发工程师相比紧密的,像器用链包括多样的应用场景,这是一个张开来看的一个系统架构。

  今天我要分享的主如果两部分,第一个是AI的底座,这一部分是因为这部分和咱们昔日一年的趋势,也便是咱们端到端自动驾驶包括大模子上车紧密接洽的,而且这一部分是在赶紧发展,这一部分有相比高的一个门槛。第二部分是个自动驾驶器用链,这一部分器用链亦然因为和诸位同仁责任接洽相比紧密,是以今天我的分享主要围绕这两部分张开。

  领先,咱们从上至下。在器用链层面,百度在3年前就领先发布了这么一个叫作念自动驾驶云或者叫汽车云的1.0版块,那时这个1.0版块针对的是一个传统的智驾斥地的这么一个模子或者叫作念范式。也便是说,它是一个基于这么一个感知、规控分模块的格局,咱们来进行数据的汇注、数据的纳管,然后进行模子的试验、进行仿真、终末模子的上车,打造咱们叫作念数据闭环。这亦然前两年很热点的话题,握住加速这么一个数据飞轮。

  这个平台的一个特色,这里有几个数据,一个是在这个平台上垄断了通过AI进行自动驾驶的预标注,数据的预标注,可以达到92%的准确率,这部分可以大略镌汰东说念主工标注资本50%。同期,支撑这么一个数百PB的数据的全生命周期的托管。然后支撑周级别的算法的迭代,这是那时的1.0版块。

  到了2.0之后,也便是自动驾驶冉冉走向量产之后,然后遭受了大批的在量产当中的长尾问题,针对这些问题咱们推出了2.0版块。2.0版块特色,它是基于提供更多的包括场景的遮盖、数据的遮盖,包括咱们百城的舆图数据的遮盖,千级以上的数据挖掘的类型、千万公里仿真场景,包括千万级的场景库的构建,通盘这些更多的是顾问自动驾驶问题当中的这些量产长尾问题。

  最近一年,连合着这个趋势,更多的元气心灵咱们花在这个端到端和车路协同,也便是咱们咫尺提到的3.0版块。3.0版块主要针对的一个是端到端,端到端其实它和大模子有好多的相似场地,咱们知说念大模子齐有一个叫scaling laws,scaling laws内部有两个弥留的维度,一个是数据一个是算力。针对数据,咱们有端到端这么一个数据生成,来支撑端到端的仿真,来提供这种海量准确的数据。第二部分,针对这个算力其实咱们打造了百度的百舸,加上咱们我方斥地的昆仑芯国产GPU来支撑端到端试验算力的需求。

  另外是路侧数据的买通,这部分我后头会提到,它相等弥留。因为咱们作念端到端、作念自动驾驶其实咱们对准的是L4,传统这种单车智能在L4上会有表面上的弱势,这亦然为什么咱们一直在强调车路协同。后头我会张开,先容一下这几个特色、这几个本性到底在说什么。

  一个是端到端的这么一个仿真,其真实传统的仿确实话,它更多仿的是规控门径,然而到出现问题的时候,这些工程师更多是调网罗或者调数据,从这两方面进行优化。然而到端到端之后有很大变化,出现Corner Case的时候,可能咱们并不需要调网罗,网罗是保握不变的。把更多的优先级或者元气心灵放在这些数据的优化上,也便是说咱们需要更多精确的海量数据(维权),这些数据从何处来?有两个部分,第一部分便是咱们照旧在路侧,千万公里路侧照旧有一个大批的场景库,包括这些视频、点云等等大批的数据,中枢的问题是何如把这些有用的数据挖掘出来,这里就有个大模子的智能搜索平台。

  第二部分是长余数据合成,只是靠路侧汇注的话这个资本相等高的,跟着时间的发展其实咱们发现咫尺可以自动生成一些场景、自动生成一些数据,而且效果也还可以。这个时候咱们有一个叫作念数据生成的一个平台,同期还有一个仿真场景,也便是咱们基于这么一个端到端的仿真,它更多是基于这么一个真实场景的场景级别的效果考证,而不再是只是考证规控这个门径,这是支撑端到端的仿真。

  第二个是支撑端到端的试验,试验来讲咫尺最大的一个瓶颈或者痛点就在算力,咫尺内容上是一个暴力的狡计,然后在算力方面主要围绕着3个方面作念提高,第一个叫作念异构芯片的多芯混训,后头我会提到,也便是说咱们把不同厂家、不同型号的这些芯片把它组在沿路、构成一个集群,这个集群可以让它完成归拢个任务,这么可以极地面利用历史金钱。

  第二个是全链路模子的试验优化,这么是提高利用率。好多东说念主买了大批的GPU卡之后,其实这个集群的利用率是很低的,大批的时辰包括算力齐是处于恬逸状态,在这种情况下咱们通过软件的形势提高集群的利用率,也便是变相的你可以买到更多的卡。

  第三个,支撑一个超大集群的,也便是万卡集群的稳重的试验,这一部分是相等弥留,因为量变产生质变,当一个万卡集群的时候是不可幸免地出现多样故障。若何让这个故障不影响试验的效果或者不影响试验的着力,是在端到端试验内部要顾问的一个相等弥留的问题。

  第三部分,车路云协同,其实咱们发现无论在高速如故在城市内部其实有大批说念路的一些数据,这些数据对自动驾驶相等有匡助。百度也一直在和监管部门包括一些说念路金钱的运营部门在配合,把这个车的数据和交通的数据能够买通,这么的话可以使自动驾驶能够愈加的安全、高效。

  这个是咱们直不雅来看一下,这个器用在干什么,因为时辰的干系我就不放视频。第一个,左边部分看到的是智能搜索,传统的搜索寰球如故靠打标签的形势,结构化的一些标签,这个是费时忙活的。还有一个更大的问题,跟着时间的迭代有些标签它不可得意需求了,还要再从头打一遍。这种情况下资本是相等高的,然而咱们发现跟着昔日一年言语大模子、视觉大模子时间的发展,然后咱们在探索是不是可以把这些时间连合起来提高数据搜索的着力。在此基础上咱们打造了一个基于视频特征库和图片特征库,同期连合语义的信息,然后完成这种跨模态的搜索,这方面比如这里左侧叫以图搜图。比如我有一个很难态状的场景,假定说便是一辆车,它长得很奇怪,这个车我不知说念何如态状它,以前也莫得打过标签,这个时候最简便的一个形势便是我去丢几张图片,它长的什么样,然后去搜一下。如果效果不好的话再丢几个反例的图片,这么把以前可能需要花周级别或者月级别的这么一个数据挖掘的任务,结束到这种分钟级别或者秒级别,这个叫作念智能搜索。

  第二个,难例的挖掘。这部分主如果以文搜图,也便是譬如说你可以通过语义和图片和这个视觉的连合,来定向挖掘多样难例数据。比如说这里,咱们这个稀奇类型的环境感知,比如说松弛路面遭受车辆。还有稀奇的复杂的一些场景,比如在夜晚骑着电动车等红绿灯的东说念主,然后还包括这种空间干系的组合、雅致化的搜索,比如在这里便是一个堆积货品的货车,相等庆幸的是语义大模子可以暴露什么是堆积货品,是以咱们可以径直搜索出来堆积货品的货车。它就可以把它雅致地给挖出来,这些齐为大模子或者端到端提供了这些准确的和海量的数据。

  然而光靠现存的数据,也便是咱们传统的格局下的说念路汇注、数据挖掘,它不可得意端到端的条目,原因便是因为端到端模子试验它其实对数据的遮盖度条目相等高。这种情况下,其实咱们就斟酌到在进行探索这种智能场景的数据生成,而且效果是相等好。这里包括比如摈斥动态元素,这种场景也便是说咱们通过汇注之后,把这些动态元素消撤回以后得到一个更为通用的、更为基础的一个场景,在这个场景上咱们连合着第四条,也便是类似臆造元素就可以形成雨后春笋的泛化的真实场景来供模子进行试验,包括不同的角度,比如说主车的视角,包括篡改天气环境等等,这些齐相比好暴露,因为时辰干系视频不逐一播放,这个看上去如故相等直不雅的。

  同期,在一个端到端的仿真内部,另一个提高便是咱们在仿确及时候除了这种对规控的仿真,除了对单车的仿真以外,再更多的是针对这个场景的一个举座效果的考证,或者说一方面来讲是针对单车来讲它不再是只考证规控门径,而是考证某个场景下的端到端的效果。  

  第二部分,从单车到通盘这个词宏不雅的角度,因为寰球齐知说念百度在作念Robotaxi,咱们作念萝卜快跑,萝卜快跑追求生意化,在这种仿真内部它相等眷注的小数是运营的着力,在运营的着力内部它除了单车的智能以外,咱们更多的要看比如咱们在北京投放一辆车、投放一个车队,和在武汉投放一个车队,它们的交通流是十足不相通的,我何如样提高举座的车队的安全度、提高举座车队的运营着力,其实触及到的便是更宏不雅的或者咱们叫作念交通流的模子。在交通流内部咱们及时地汇注交通真实的景色。

  第二个,可以来建模,也便是说在这个环境内部不同的交通参与者他们的一些行径格局,然后握住和真实情况来作念对比,从而提高自动驾驶的着力。咱们自动驾驶最终是对准L4的,L4最弥留的一个场景或者绝大多数的一个场景其实是分享出行,也便是Robotaxi,在分享出行内部不单是看到单车,咱们要看到通盘这个词车队的、通盘这个词城市的运营着力。

  刚才一部分更多先容器用链,这部分跟业务紧密接洽。底下这一部分先容更多的是咱们叫作念百舸平台,也便是咱们的AI大底座,AI大底座更多顾问的是算力的问题。就像刚才提到的,在算力问题中第一个来讲便是异构芯片的多芯试验,这部摊派理的问题是,咱们知说念好多车厂包括这些自动驾驶公司其实齐买了大批的卡,然而这个卡是在不同期期买过来的,有英伟达的卡、有国内的卡,英伟达的卡有不同的型号。

  现存的场所基本上是归拢类型的卡或者归拢型号的卡构成一个小集群,这个集群内部完成一个单一的任务,比如完成一个推理任务、一个试验任务。然而跟着芯片的握住迭代之后,这种芯片的厂家和它的型号越来越复杂,若何让这些不同型号以至不同厂家的这些卡在一个集群内部开动,这是一个相等弥留的问题。这个问题难度其实相等大,寰球知说念GPU卡的话,不同的供应商从他们的通信条约、架构、算子库齐是不兼容的,百度作念了一项责任,基础型的责任,便是咱们把通盘这些卡把它兼容起来。第一步结束的,也便是在单一集群内部多样不同厂家的卡、不同型号的卡可以混布在沿路作念试验。

  第二部分,这件责任天然也可以去作念,前提是这么作念下去不会酿成性能的亏空。性能亏空很好暴露,比如性能高的这些卡在完成任务的时候它跑的快一些,它跑完之后它就等,等着那些性能差的这些卡再提交任务。这个时候这些性能差的卡就形成了一个瓶颈,咱们若何来摈斥这些瓶颈,这是一个相等基础性的责任。通过昔日一年的时辰,咱们可以作念到在万卡集群算力亏空少于3%,也便是说基本上你可以看不到各别。

  当咱们完成了集群的混布之后,还有一个弥留的课题便是算力的利用率是很低的,咱们若何来提高算力的利用率,算力利用率很低后头根底的原因便是,在GPU内部它的狡计这一部分的性能是相等高的,然而它的存储和网罗这部分性能相对来讲弱一些。是以频频酿成狡计任务完成之后在等数据,这么恭候的时辰占了大批的时辰,这个时候酿成性能的瓶颈。

  是以说,针对利用率的提高,其实咱们作念了多重的优化责任,包括显存优化、算子优化、存储优化和网罗优化,这些我就不逐一张开,因为这些相等工程化,包括这些并行优化。然而寰球可以念念象的便是,它和交通流的格局相等相似的。也便是说我有多个任务的话,当它莫得一个很好的优化顾问的话,比如在上海这个城市,当寰球齐去出行的时候,我为了保证不拥挤可能需要把车说念修到8车说念、10车说念,这是通过硬件来提高。然而通过这种软件优化之后,然后我通过合理的调和,通过不同的战略包括像绿波等等,寰球可以并行的来出行。这么咱们可能不再需要8个车说念、10个车说念,可能只需要2个车说念、4个车说念,通过这种雅致化的规章就可以使着力得到提高,使出行不会产生拥挤,其实优化部分中枢顾问的便是这么一个责任。然后试验效果来讲,寰球可以看到在试验方面,关于一个70B的模子,这亦然咫尺主流的一个试验模子的范畴。然后1.4T的语料在传统的,便是在莫得优化前通过A800的这么一个卡大略需要21天的试验时长,然后通过这个优化之后。21天试验时长在传统的莫得优化之前大略需要2000卡的A800,然后通过优化之后大略可以从简23%的算力。

  然后在推理这个应用内部,这是一个真实的案例,也便是日活500万的AI应用,在传统莫得优化之前大略需要178张的A800的卡,通过优化之后大略可以从简55%的算力,这个从简的算力便是真金白银的降本增效。

  第三部摊派理的是稳重性的问题,稳重性的问题中枢来讲,咱们其实看到底下有个公式,在通盘这个词万卡集群这么算下来它总归有些故障点,有一些硬件它失效,失效之后表面上就会酿成任务的无效试验时辰。这部分算了一半之后卡坏了,那我就要回到上一个保存的点从头再来算,这个便是从上一个咱们作念的阿谁保存点到失效的这个部分,其实便是个无效的试验时辰。咱们若何压缩无效试验时辰便是中枢问题,压缩无效试验时辰把柄这个公式的话主如果3个方面。

  一个是镌汰故障的中断次数,天然硬件的故障咱们是没见识镌汰的,但咱们可以通过平台、多维的故障感知之后,通过平台级的容错来使得在平台试验的任务层面让这个任务不中断。第二个,便是中断之后它有两个时辰,便是是一个故障的复原时长加上故障的重算时长,这部分也就暴露为就异常于这个硬件坏了之后我这个还没算完的这些任务就白算了,我若何减少白算的这些任务,这一部分便是通过多维的容错处理、包括这个节点的维修、秒级的冷移动复原、自动故障结巴、自动任务休养等等来减少这个时长。

  第三部分是常态写Ckpt,因为有故障是以每隔一段时辰咱们就要把责任保存一下,就像一个快照相通,咱们把现存的试验保存一个快照,这个叫Ckpt。但这个写Ckpt是一个相等长的时辰。在这一部分咱们就用了一些时间包括秒级的Ckpt写入,异步的加速、包括散布式加速等等来镌汰Ckpt的总时长。

  终末可以使咱们万卡集群的灵验试验时长达到98.8%,带宽的灵验性达到95%。这是一个相等了不得的成立,这亦然寰球知说念背后除了时间本人的卓越以外,中枢的如故要降本,尤其是在这种大模子界限。

  终末一部分咱们要说的是这么一个车路云的协同。咱们看到左侧有多样各类的Corner Case,其实有些Corner Case便是从隧说念的这种单车智能的话,无论你有何等卓越的激光雷达等传感器,它有些讳饰或者有些天气情况便是失效,表面上它便是在ODD可开动以外的。也便是说,关于这一些部分的话其实单车智能并不是唯独的一个门路,而关于这一部分Corner Case的话,其实关于说念路的金钱顾问部门来讲他们有相等精确的数据、相等及时的数据,这些数据百度就一直在,和监管部门配合,但愿这些数据能够来和车端的数据才能来会通,从而形成一个天主视角的路面情况。这种情况下就可以极地面提高车辆的安全性,因为有些Corner Case,说真话靠单车智能是无法去顾问的,也便是说顾问的一个旅途可能便是车路协同。其实中国在车路协同方面是有一定上风的,包括咱们的这种5G的这些网罗基础设施建造,包括有一个强力的大政府,便是咱们可以建立这种定约、这种程序。在这一方面咱们在旧年也和广杂乱团作念了相等多的一些探索,赢得了一些相比好的效果,包括这两天寰球看了上海汽车城在这方面亦然走在前哨。

  咱们信服,车路协同在L4自动驾驶场景内部会越来越弥留。这么咱们也相等但愿和诸位行业同仁一块悉力,共同打造这么一个有中国特色的、基于车路云一体的,宇宙卓越的自动驾驶顾问有策动。

  我的分享就到这里,谢谢寰球!   

  (注:本文把柄现场速记整理,未经演讲嘉宾审阅)

海量资讯、精确解读,尽在新浪财经APP

拖累剪辑:梁斌 SF055开云kaiyun



上一篇:外围球赛软件搞迷信手脚;违抗中央八项端正精神-外围球赛软件
下一篇:开云kaiyun胡耀邦总文告乘“合肥号”驱散舰巡洋考核胶南沿海-外围球赛软件
TOP