Arm의 연례 기술 컨퍼런스가 종료되고 차세대 AI 컴퓨팅 플랫폼이 진행 중입니다.

오늘 오후, 연례 Arm Tech Symposia 연례 기술 컨퍼런스가 심천에서 성공적으로 마무리되었습니다.

이번 컨퍼런스에서 Arm은 AI의 컴퓨팅 요구사항에 대해 깊이 논의하고 하드웨어, 소프트웨어, 생태계의 3가지 핵심을 통해 AI의 개발 기회를 더 잘 파악하는 방법을 공유했습니다. 참석자들은 Arm 기반 기술 혁신과 AI 개발 동향에 대해서도 논의했습니다.

Arm 터미널 사업부의 제품 관리 부사장인 James McNiven은 심천 컨퍼런스의 기조 연설에서 Arm의 최신 기술 아키텍처인 Armv9이 출시 당시 AI 컴퓨팅을 지원하도록 설계되었으며 계속해서 반복적으로 업데이트되고 있음을 강조했습니다. SVE, SVE2, SME 및 기타 핵심 기술을 통해 Arm은 아키텍처 혁신과 강력한 소프트웨어 및 하드웨어 시너지 기능으로 모바일 AI 경험을 지속적으로 최적화하여 개발자가 탁월한 AI 성능을 달성할 수 있도록 지원합니다.

이번 컨퍼런스에서 KleidiAI 소프트웨어는 주목할 만한 하이라이트 중 하나입니다.

주류 AI 프레임워크와의 긴밀한 통합을 달성하고 Arm CSS와 함께 사용하면 개발자에게 원활한 개발 경험을 제공할 수 있습니다. KleidiAI는 Neon을 통합합니다. , SVE2 및 SME2 등을 사용하여 컴퓨팅 애플리케이션의 성능을 크게 향상시킵니다.

KleidiAI는 AI 프레임워크 개발자를 위해 특별히 설계된 고성능 컴퓨팅 코어 세트인 것으로 알려졌습니다.

이를 통해 개발자는 다양한 장치에서 Arm CPU의 최고의 성능을 쉽게 얻고 Neon, SVE2, SME2와 같은 주요 Arm 아키텍처의 핵심 기능을 활용할 수 있습니다.

또한 KleidiAI는 PyTorch, Tensorflow 및 MediaPipe와 같은 널리 사용되는 AI 프레임워크를 통합하고 Meta Llama 3 및 Phi-3과 같은 모델의 성능을 최적화하며 이전 버전 및 이후 버전과 호환되는 디자인을 채택합니다.

이것의 장점은 Arm이 미래에 더 많은 기술을 도입할 때 미래 시장 요구에 계속 적응할 수 있다는 것입니다.

보고서에 따르면 KleidiAI의 통합으로 생성 AI의 효율성이 크게 향상되었습니다.

데이터는 새로운 Arm Cortex-X925 CPU, llama.cpp(KleidiAI 통합 포함) 및 Microsoft Phi -3을 사용하는 Meta Llama 3의 참조 구현(llama.cpp 기반, Kleidi 소프트웨어 최적화 제외)과 비교한 결과를 보여줍니다. LLM(대형 언어 모델) 토큰의 첫 번째 응답 시간이 190% 빨라졌습니다.

KleidiAI의 또 다른 큰 장점은 통합이 쉽다는 것입니다.

Arm 엔지니어링팀은 24시간도 안 돼 라마 3의 성능 최적화 테스트를 완료한 것으로 알려졌다.

또한 KleidiAI는 XNNPACK을 통해 MediaPipe와 통합되어 모바일 장치에서 실행되는 오픈 소스 Gemma LLM에 대한 지원을 제공합니다. 덕분에 Google Pixel 8 Pro 스마트폰에서 Gemma 2B의 첫 단어 응답 시간이 25% 단축되었습니다.

동시에 Arm은 Unity와 협력하여 최종 AI 추론 엔진인 Sentis를 개발하고 있습니다. 이를 통해 게임 개발자는 Unity 게임 엔진을 지원하는 모든 기기에서 새로운 AI 게임 경험을 만들 수 있습니다.

또한 현재까지 가장 빠른 Arm 컴퓨팅 플랫폼인 Arm 터미널 CSS는 컴퓨팅 및 그래픽 성능이 30% 이상 향상되어 다양한 까다로운 Android 워크로드를 처리하기에 충분합니다.

동시에 Arm 터미널 CSS는 AI 추론 속도도 59% 향상시켜 광범위한 AI/머신러닝(ML) 및 컴퓨팅 비전 워크로드에 적합하게 만듭니다.

Arm 터미널 CSS의 핵심 장점은 현재까지 Arm의 가장 강력하고 효율적이며 포괄적인 CPU 클러스터를 갖추고 있으며 성능과 에너지 효율성 간의 최상의 균형을 달성하기 위해 노력하고 있다는 것입니다.

차세대 Arm Cortex®-X CPU를 통해 AI에 최적화된 Arm 터미널 CSS는 새로운 Arm Immortalis의 성능을 36% 향상시켜 전년 대비 최고의 IPC 개선을 제공합니다. GPU 그래픽 성능이 37% 향상되었습니다.

Arm Immortalis-G925 GPU는 Arm의 가장 강력하고 효율적인 GPU로, 여러 모바일 게임 애플리케이션에서 37%의 성능 향상을 달성하고, 여러 AI 및 ML 네트워크에서 34%의 성능 향상을 달성했습니다.

Immortalis-G925는 주로 플래그십 스마트폰 시장을 타깃으로 하고 있다.

그리고 Arm Mali를 포함하여 -G725 및 Mali-G625 GPU를 포함한 확장성이 뛰어난 새로운 GPU 시리즈는 고급 휴대폰부터 스마트 시계 및 XR 웨어러블 장치에 이르기까지 광범위한 소비자 가전 장치 시장을 대상으로 합니다.

Arm은 2025년 말까지 전 세계적으로 AI 기능을 갖춘 Arm 장치가 1000억 개가 넘을 것으로 예측하고 있습니다.

센서와 스마트폰부터 산업용 사물인터넷, 자동차, 데이터센터에 이르기까지, 초고층 빌딩을 짓는 데 견고한 기반이 필요한 것처럼 AI 기술의 활발한 발전은 강력하고 효율적인 컴퓨팅 플랫폼의 지원과 분리될 수 없습니다.

Arm은 칩 아키텍처와 기술 혁신에 대한 끊임없는 노력을 통해 이 "AI 스카이스크래퍼"를 위한 가장 신뢰할 수 있는 기반을 구축하고 있으며 이러한 기술 변화에서 점점 더 중요한 역할을 할 것입니다.

# aifaner 공식 WeChat 공개 계정: aifaner(WeChat ID: ifanr) 팔로우를 환영합니다. 더 흥미로운 콘텐츠가 최대한 빨리 제공될 예정입니다.

Ai Faner | 원본 링크 · 댓글 보기 · Sina Weibo