화웨이 ADS3.0 스마트 운전 경험: ‘엔드 투 엔드(End-to-End)’는 새로운 기술의 벽이다

지능형 보조 운전의 '스마트' 성능은 신에너지 차량의 보급률이 급격히 증가하면서 빠르게 변화하고 있습니다.

파일럿 보조 운전이 "사진 포함"에서 "사진 없음"까지 기술 경로의 반복을 확립한 후 "엔드 투 엔드"가 지능형 운전 분야의 새로운 목표가 되었습니다.

올해 초 Tesla는 '엔드 투 엔드 신경망 모델'이 탑재된 최초의 FSD v12 감독 버전을 출시했으며, 이어 Hongmeng Zhixing, Ideal, Xpeng 등 스마트 드라이빙의 최전선에 있는 여러 OEM이 출시했습니다. '엔드 투 엔드' 스마트 드라이빙 양산은 하반기 중요한 목표 중 하나다.

최근 동체희는 공공도로에서 최신 화웨이 ADS 3.0의 '엔드투엔드' 스마트 주행 성능 도 경험했다.

사실, 꽤 인상적입니다.

Huawei ADS3.0의 실제 성능 "엔드 투 엔드": 한 주차 공간에서 다른 주차 공간까지 지능형 주행

광고를 보지말고 효능을 보세요.

사용자가 가장 관심을 두는 부분은 도로 주행 시 "엔드 투 엔드" ADS3.0이 어떻게 작동하는지입니다. 실제 애플리케이션 수준에서 Huawei ADS 3.0은 "주차 공간에서 주차 공간까지" 물리적 엔드투엔드를 실현합니다.

앞서 우리는 Huawei ADS3.0이 탑재된 최초의 Xiangjie S9를 시승했습니다. '엔드투엔드' 생체공학 신경망 모델 덕분에 Xiangjie S9는 전국적으로 주행이 가능하며 주차 공간 시작, 길가 출발, 길가 정지, 언제든지 목적지 변경, 자율 게이트 통과 등의 기능을 갖추고 있습니다. 기계와 같은 지능형 운전 기능의 일련의 업그레이드는 지능형 보조 운전을 사용하여 모든 시나리오를 관통하고 "도로가 있는 곳 어디든 운전"을 달성하기 위해 노력하고 있습니다.

공식적으로 계획된 시운전 경로도 꽤 흥미롭습니다. 우리는 쑤저우의 포시즌스 호텔 지하에서 직접 출발했고 목적지는 르네상스 타이후 호텔 지하였습니다. 전체 여행은 40km가 넘었고 약 1시간이 걸렸습니다.

두 곳 모두 지하주차장을 스캔하여 내비게이션으로 "자주 이용하는 주차공간"으로 인식할 수 있기 때문에 포시즌스 호텔 지하주차장을 호텔 지하주차장으로 설정할 수 있습니다. 르네상스 호텔 내비게이션을 선택한 후 스티어링 휠에 있는 스마트 운전 버튼을 직접 클릭하면 Xiangjie S9이 스마트하게 주차 공간에서 주차하고 포시즌스 호텔 지하에서 빠져나옵니다.

포시즌스 호텔 지하 입구는 매우 좁은 직각 굴곡임에도 불구하고 S9을 당황하게 하지 않고 벽에 달라붙어 능숙하게 빠져나왔다. 인식 게이트는 자동으로 감속하고 가속하기 전에 레버가 올라갈 때까지 기다릴 수도 있습니다.

호텔 공원의 도로는 원래 내비게이션 지도에 표시되지 않지만 Xiangjie S9의 환경 인식 및 의사 결정 기능이 업그레이드되어 급행 차량을 피할 수 있을 뿐만 아니라 일시적인 장애물도 피할 수 있습니다.

로터리를 마주할 때도 매우 조용했고 비교적 빠른 속도로 로터리를 완주했으며 핸들을 매우 빠르게 돌렸습니다.

예전에 인계받아야 했던 유턴 장면은 이제 ADS3.0으로 인계받을 필요가 없습니다. 스마트 드라이버가 핸들만 돌리면 유턴이 끝납니다.

신호등 식별 감각도 더욱 예민해졌다. 초록불이 깜빡일 때 차량은 이미 이를 포착해 미리 예측하고 자동으로 천천히 감속해 빨간불이 들어오기 전에 꾸준히 정지한다.

일부 복잡한 시나리오에 직면했을 때 ADS 3.0의 엔드투엔드 장점이 드러납니다. 가장 오른쪽 차선을 이용해야 하고 필요한 차선이 점유되어 있고 도로 표시가 명확하지 않은 장면에서 Xiangjie S9는 차선 변경을 과감하게 취소하고 주변에서 가속을 선택하여 부드러움이 실제 베테랑 운전자와 비슷합니다. , 그는 미리 예측했습니다.

고속도로에서 이제 Xiangjie S9는 경사로를 오르내릴 때 더 이상 인계받을 필요가 없으며 지속적인 차선 변경에도 신속하게 대응할 수 있습니다.

유일한 단점은 차선 변경이 예전처럼 활발하다는 점이다. 표준 상태에서도 차선을 변경한 후에도 의도적으로 차선을 변경하지 않아도 다시 차선을 변경해야 하는 경우가 많다는 것을 느낀다. 상사들이 Xiangjie S9의 뒷줄에 앉는 경우가 많다는 점을 고려하면 이러한 차선 변경 경험은 상사들로부터 비판을 받아야 하는 것이겠죠?

아마도 Xiangjie S9는 차선 변경 시 덜 공격적이고 보다 안전하게 운전할 수 있도록 특별히 조정된 스마트 주행 버전을 고려할 수 있을까요? 이러한 상황을 완화하기 위해 NCA의 차선 변경 기본 설정을 기본적으로 '소프트'로 설정하여 추월을 위한 차선 변경 빈도를 줄이는 것도 고려할 수 있습니다. 하지만 이 방법으로는 완전 무인식 스마트 드라이빙 성능을 달성할 가능성은 낮다.

마침내 우리는 내비게이션 목적지인 르네상스 호텔 입구에 성공적으로 도착했고, 이후 Xiangjie S9이 원활하게 자동으로 지하 차고로 진입하여 대상 주차 공간을 찾아 스스로 주차했습니다. Full NCA와 Zero Takeover로 주차공간부터 주차공간까지 End-to-End 스마트 드라이빙을 실현합니다.

엔드투엔드 스마트 드라이빙의 가치를 측정하려면 주차공간부터 주차공간까지의 물리적인 엔드투엔드 성능을 활용하는 것이 더 이해하기 쉽고 포괄적이라고 생각합니다.

"엔드 투 엔드(end-to-end)" 모델의 지원으로 ADS 3.0의 지능형 주행 성능은 지능형 주행에 대한 우리의 주관적인 상상에 더 부합하며, 교통 효율성도 크게 향상되었습니다.

이때 유씨가 다시 "(화웨이 ADS)는 L3에 무한히 가깝다"고 말한다면 의심은 훨씬 줄어들 것이다.

Huawei ADS 3.0의 "엔드 투 엔드" 기술 로드맵에는 어떤 차이점이 있습니까?

화웨이의 ADS 2.0 스마트 운전 솔루션에서 화웨이는 레이저 융합을 기반으로 한 GOD 네트워크를 제안했습니다. 이 네트워크는 RCR 도로 위상 추론 네트워크와 협력하여 "사진 유무에 관계없이 운전"이라는 스마트 운전 성능을 달성하고 차량이 실제 물체를 식별할 수 있도록 합니다. 보편적인 장애물, 기본적으로 인간과 유사한 인식 능력, 그리고 궁극적으로 대량 생산을 통해 "전국"을 주행할 수 있는 지도 없는 NCA 지능형 주행 능력을 달성합니다.

▲ 화웨이 ADS 2.0 BEV+GOD+RCR 네트워크

그 중 GOD 네트워크(General Obstacle Protection, 일반 장애물 감지 네트워크)는 LiDAR + 카메라를 사용하여 일반 장애물 화이트리스트 외부의 특수한 모양의 개체를 식별할 수 있습니다. 예를 들어 게임 'Minecraft'와 같이 3D 픽셀 블록을 사용하여 구축할 수 있을 뿐만 아니라 장애물의 동적 및 정적 상태를 식별할 뿐만 아니라 구급차, 경찰차, 보행자 등을 일치시키고 구별합니다.

▲ GOD 센싱 알고리즘 다이어그램 (사진출처: 화웨이 공식 홈페이지)

GOD 네트워크를 사용하면 지능형 주행 시스템은 더 이상 도로 위의 장애물 인식에 상한선을 두지 않고 진정으로 "사물을 이해"할 수 있습니다.

▲ 외계인 장애물 '월드' (사진출처: 화웨이 공식 홈페이지)

RCR 네트워크(Road Cognition & Reasoning, 도로 지형 추론 네트워크)는 지능형 주행이 고정밀 지도에 의존하는 것에서 더욱 자유로워지고 이를 일반 내비게이션 지도와 결합해 현실을 일치 검증한 후 센서를 이용해 넘어져 이용 가능한 지도를 그리는 것이다. 실시간 지도.

RCR 네트워크를 통해 지능형 주행 시스템은 '특정 도로 상황에 대한 구체적인 분석'을 달성하고 진정으로 '도로를 이해'할 수 있습니다.

기존의 스마트 드라이빙은 센싱 데이터를 컨트롤에 전송해 매칭과 식별을 한 후 컨트롤에 제어 명령을 출력하는 '인식-계획(결정)-제어' 연구개발 로직을 기반으로 했음을 알 수 있다. 운전하는 차량.

센서가 감지한 "이 질문"(교통 상황 정보)이 문제 은행에서 수행된 질문(훈련된 특징 정보)인 경우, 제어 측에서는 "정답"(올바른 의사 결정 계획)을 제공할 수 있습니다. 차량은 현재 도로 상황에 완벽하게 적응할 수 있습니다.

결국 수천 개의 도로가 있고 안전이 최우선입니다. 도로 상황은 빠르게 변화하고 있으며, 훈련되지 않은 일부 시나리오에 직면하면 지능형 운전 시스템은 혼란에 빠지고 인간 운전자가 차량을 운전하도록 유도할 수 있습니다.

지능형 주행의 제어 성능을 향상시키고, 지능형 주행이 인간처럼 운전할 수 있도록 하기 위해서는 지능형 주행 시스템이 인간처럼 생각할 수 있어야 합니다 .

이에 따라 스마트 드라이빙은 거대한 신경망을 기반으로 구축된 ChatGPT와 같은 대규모 언어 모델을 도입하기 시작했습니다. 스마트 드라이빙 시스템은 센서로부터 수신된 감각 데이터를 직접 처리하는 '엔드 투 엔드 모델'을 사용합니다. 프로세스를 거쳐 판단과 의사결정을 완료하고 최종적으로 제어 명령을 출력합니다.

ADS 3.0에서 화웨이는 GOD와 RCR을 모두 신경망으로 변환하고, 알고리즘의 이 부분을 완전한 GOD 인식 신경망에 통합한 다음, 인식 데이터를 PDP 의사 결정 신경망에 전달하여 주행 경로와 출력을 계획했습니다. " 생각의 결과.

Huawei는 GOD+PDP 신경망 모델을 구축한 후 자체 클라우드 AI 훈련 플랫폼을 사용하여 대량의 데이터 훈련을 수행하여 모델을 신속하게 반복적으로 업그레이드할 수 있었습니다.

ADS3.0은 GOD 네트워크의 다차원적 3차원 인식 기능을 개선하고 "엔드 투 엔드" 의사 결정의 PDP를 사용한 후 De-BEV를 달성하고 원래의 "객체에 대한 이해"에서 업그레이드할 수 있습니다. 스마트 드라이빙 시스템이 보다 효율적이고 정확하게 "운전 장면을 이해 "하고, 지연 시간이 짧은 의사 결정 속도로 복잡한 도로 상황을 자율적으로 처리하며, 사용자에게 더욱 원활하고 확실하며 무중단 운전을 제공합니다. 스마트 운전 경험을 인수합니다.

그러나 현재 초기 훈련 결과에 따르면 AI가 운전석에 직접 앉아 운전하도록 하는 것은 아직 너무 과격하다. 현재 화웨이의 엔드 투 엔드 모델에는 지능형 운전의 하한을 커버하기 위해 '본능적 안전 네트워크' 도 추가되어 의사 결정 신경망이 안전 한계선을 초과하지 않도록 보장합니다.

Wu Xinzhou는 장기적으로 엔드 투 엔드가 기존 자율 주행 스택과 병행하여 실행될 것이라고 언급한 적이 있습니다. 처음에는 엔드 투 엔드 모델이 인간 운전, 기존 스택 및 엔드 투 엔드를 비교하기 위해 섀도우 모드에서 실행될 것입니다. -동일한 시나리오에서 최종 알고리즘 출력 및 인간 피드백을 기반으로 한 미세 조정의 차이는 기존 기술 스택과 유사할 수 있으며, 성숙 후에는 두 가지가 서로 보완될 수 있습니다. 단계적으로 폐지됩니다.

엔드-투-엔드 알고리즘은 어린 시절의 천재 소년과 같습니다. 비록 나중에 의사가 될 수도 있지만, 자라면서 그를 가르쳐 줄 초등학교와 중학교 교사가 필요합니다. 시간이 지나면서 그는 결국 홀로 설 수 있는 강력한 '전문가'로 성장하게 될 것이다.

따라서 Huawei ADS3.0의 엔드투엔드 생체공학 두뇌이든, Ideal AD의 빠르고 느린 시스템이든, Xpeng의 Xnet+Xbrain+Xplanner 아키텍처이든, 엔드투엔드 결정 사이에 상당한 노력이 이루어졌습니다. 제작 및 차량 제어. 많은 제약 및 중복 조치.

일반적으로 말해서, 엔드투엔드 지능형 운전의 현재 목적은 지능형 운전 시스템의 아키텍처를 단순화하고, 단일 신경망 모델을 사용하여 전체 지능형 운전 시스템의 인식 및 의사 결정 작업을 완료하고, 의존성을 줄이는 것입니다. 스마트 드라이빙의 실제 효과는 사용자의 실제 스마트 드라이빙 요구 사항을 충족합니다.

기존의 스마트 드라이빙 전략을 살펴보면, 한 주차 공간에서 다른 주차 공간으로의 스마트 드라이빙 제로 인수는커녕, 로터리 주행과 유턴 측면에서도 스마트 드라이빙이 정상적으로 자율주행을 하는 경우는 거의 없다. 시간이 지나면 인간 운전자에게 인계를 요청해야 합니다.

간단히 말해, ADS 3.0의 실제 엔드투엔드 경험을 바탕으로 대형 모델을 사용하여 스마트 드라이빙을 더욱 인간과 유사하게 만듭니다. 전국 어디에서나 주행이 가능하며, 업그레이드 후 도로가 있으면 주행이 가능합니다.

엔드 투 엔드(End-to-End) 스마트 드라이빙이 대세이며, 자동차 회사들은 이를 따라잡기 위해 안간힘을 쓰고 있습니다.

중국의 자동차는 전기화와 지능화 분야에서 급속한 발전을 이루고 있으며, 이는 자동차에 대한 소비자의 선호도와 선택을 재편하고 있습니다. 그 중에서도 스마트 드라이빙은 신에너지 자동차 지능화의 중요한 특징으로 자리 잡았으며, 스마트 드라이빙에 대한 소비자의 이해와 가치 인식은 나날이 높아지고 있습니다.

소비자 시장의 수요 선택으로 인해 자동차 회사는 전동화와 지능화를 더욱 긴밀하게 수용하게 되었습니다. 스마트 조종석과 스마트 드라이빙을 잘 수행해야만 지능화의 후반부에 발판을 마련할 수 있습니다.

따라서 스마트 드라이빙에서 뛰어난 경쟁 우위를 갖고 있지 않은 자동차 회사들은 스마트 드라이빙의 단점을 보완하기 위해 최선을 다하고 있습니다.

최근 논란이 된 지 크립톤(Ji Krypton)과 마찬가지로 2024년형 지 크립톤 001이 출시된 지 몇 달 만에 새로운 컴퓨팅 플랫폼이 듀얼 모빌아이 EyeQ5H에서 듀얼 엔비디아 OrinX로 업그레이드됐다. 이에 비해 모델 24의 컴퓨팅 성능은 48Tops에 불과한 반면, 모델 25의 컴퓨팅 성능은 508Tops로 10배 더 강력합니다.

이 움직임은 많은 오래된 자동차 소유자들 사이에서 불만을 불러일으켰지만 지 크립톤에게는 최후의 수단이었습니다.

Jikrypton의 답변에 따르면 2025년 Jikrypton 001은 더 많은 잠재 사용자를 만족시키기 위해 이번에 출시될 예정입니다.

JKr 007이 탑재된 Haohan 지능형 운전 시스템은 사용자와 업계로부터 호평을 받았습니다. JKr 001의 많은 잠재 사용자는 동시에 당사 브랜드인 NPS(Net Promoter Score, Net Promoter)를 선택하도록 요청했습니다. Score) 조사에서도 스마트 드라이빙이 사용자가 직크립톤 001을 선택하는데 영향을 미치는 요인으로 나타났다. 이에 우리는 사용자에게 선택권을 더 주기 위해 자체 개발한 스마트 드라이빙 솔루션을 출시하기로 내부 결정을 내렸습니다.

모빌아이의 스마트 드라이빙 솔루션과 비교하면, 자체 개발한 스마트 드라이빙 솔루션은 스마트 드라이빙 경험 측면에서 일부 사용자의 평판을 분명히 회복할 수 있지만 자체 개발 스마트 드라이빙으로의 전환은 너무 늦을 것 같습니다. 이러한 업그레이드 및 업데이트 빈도는 가치 보존의 관점에서 잠재적 사용자의 신뢰에 영향을 미칠 것입니다.

과목 성적이 좋지 않은 학생들은 열심히 노력하여 부족한 점을 보완하겠다는 각오를 하고 있는 반면, 최상위권 학생들은 이미 새 학기 주제를 공부하기 시작했습니다.

홍멍지싱(Hongmeng Zhixing), 엑스펑(Xpeng), 아이디얼(Ideal) 등 '스마트 드라이빙'을 눈에 띄는 브랜드 라벨로 삼은 자동차 회사들은 사진에 없는 스마트 드라이빙 '전국 운전 가능'을 양산해 출시해 이제는 심지어 more 엔드투엔드 대형 모델 지능형 주행 솔루션 구축을 시작하세요.

사용자의 출퇴근길을 문 밖으로부터 문으로 들어가기까지 완벽하게 커버하고 AI 스마트 드라이빙에 완전히 맡기겠다는 목표는 모두 비슷하다. 규칙을 따르는 기존의 스마트 드라이빙 솔루션과 비교하여, 엔드투엔드 스마트 드라이빙 솔루션은 스마트 드라이빙의 알고리즘 엔지니어링에서 데이터 엔지니어링으로의 전환을 촉진할 것입니다.

엔드 투 엔드 포커 테이블에 앉으려면 충분한 칩이 필요합니다

ADS1.0에서 ADS2.0으로 반복하면서 Huawei의 ADS 팀은 풀 스택 자체 개발 AI 교육 시스템을 공개한 적이 있습니다.

대규모 지능형 운전 모델을 구축하기 위한 가장 견고한 기반과 자신감은 화웨이의 자체 클라우드 AI 교육 플랫폼에서 비롯됩니다. 당시 이들은 이미 대부분의 경쟁업체보다 앞선 초고성능 컴퓨팅 성능을 사용하여 하루 24시간 모델 훈련을 수행하여 5일마다 1회 반복의 업그레이드 속도를 달성했습니다.

ADS3.0의 엔드 투 엔드에 이르러 학습 및 훈련의 컴퓨팅 성능은 반년 전에 발표된 3.5E FLOPS에서 5E FLOPS로 업데이트되었습니다(Yu씨는 또한 3.5E 컴퓨팅 성능이 이미 중국 2위와 3위를 합친 모델의 일일 훈련 주행 거리는 3,500만km에 이릅니다. 더욱이 이 컴퓨팅 성능 수치는 Huawei ADS의 종착점이 아니지만 지속적으로 투자를 늘리고 지속적으로 개선할 것입니다.

지능형 운전이 심해로 진입함에 따라 대규모 지능형 운전 AI 모델의 훈련은 방대하고 다양한 고품질 데이터와 불가분의 관계입니다. 동시에 자동화되고 높은 수준의 데이터 처리 시스템도 중요합니다. 엔드투엔드 스마트 드라이빙 개발에 있어서 연구개발 비용의 최대 80%는 데이터가 차지할 것이라고 할 수 있다.

이전에 대규모 언어 모델이 많은 수의 매개변수를 강조한 것처럼 엔드투엔드 다중 모드 모델도 데이터에 대한 수요가 높습니다. Tesla는 FSD V12에서 엔드투엔드 모델을 구현하는 데 앞장섰고 Musk는 다음과 같이 말한 적이 있습니다.

100만 개의 비디오 조각으로 훈련하는 것만으로는 충분하지 않습니다. 200만 개라면 약간 더 좋을 것입니다. 1000만 개라면 굉장할 것입니다.

따라서 자동차 회사에서 양산하는 지능형 운전 차량은 최고의 데이터 수집 도구로 자리잡고 있습니다. 대량 생산된 스마트 운전 차량이 도로를 주행할 때 수집된 실제 데이터는 스마트 운전 알고리즘의 지속적인 최적화 및 반복을 위한 핵심 리소스가 될 것입니다.

▲Tesla Fleet 출처: Tesla North America 공식 웹사이트

자동차 회사가 공개한 데이터에 따르면 Tesla는 북미에서 약 300만~400만 대의 차량을 보유하고 있으며, 2024년 말까지 Huawei의 지능형 운전 시스템을 탑재한 차량 수가 500,000대를 초과할 것으로 예상됩니다. 2024년 말, 해당 분기에 Lideal은 700,000대 이상의 차량을 납품했으며, 2024년 4월 기준으로 모든 모델에 AD 지능형 운전 기능이 기본 탑재되어 NIO 지능형 운전 사용자 수가 총 495,300명에 달했습니다. NOP+ 사용자가 245,800명에 도달했습니다.

그러므로 방대한 컴퓨팅 파워 뒤에는 자기 연구력, 풍부한 자금, 높은 시장 점유율의 보완이 있습니다.

화웨이의 ADS3.0 양산은 엔드투엔드 지능형 주행 모델이 양산, 상용화 가능하다는 점을 입증하기에 충분하다. 올바른 기술 경로를 확고히 준수하고 장기적인 투자를 달성할 수 있습니다.

이러한 관점에서 소프트와 하드 기능을 통합한 '엔드 투 엔드' 지능형 주행 모델은 지능형 주행을 위한 'AI 기술 벽'이 될 것입니다.

어떤 도로에서도 주행할 수 있는 엔드투엔드 스마트 드라이빙은 스마트 드라이빙 분야의 새로운 기준임은 분명합니다. 그러나 기술적인 벽 밖에서는 여전히 스마트 드라이빙의 약속을 이행하지 못하는 자동차 모델이 많이 있습니다. 전국적으로 운행이 가능한 차량입니다.

마침내 '엔드 투 엔드 스마트 드라이빙' 포커 테이블 대회에 참가할 수 있는 플레이어는 앞을 내다볼 수 있는 용기도 필요할 뿐만 아니라 단기적으로는 충분한 칩도 필요합니다.

# aifaner 공식 WeChat 공개 계정: aifaner(WeChat ID: ifanr) 팔로우를 환영합니다. 더 흥미로운 콘텐츠가 최대한 빨리 제공될 예정입니다.

Ai Faner | 원본 링크 · 댓글 보기 · Sina Weibo


게시됨

카테고리

작성자

태그: