Samsung Galaxy S24의 AI 기능에 너무 흥분하지 마십시오

노란색 Samsung Galaxy S24의 렌더링.
아르센 루팡 / X

“모바일 AI의 새로운 시대.” 이것이 바로 삼성이 갤럭시 S24 시리즈 에서 곧 출시될 스마트폰을 홍보하는 방법입니다. 이달 말 열리는 언팩 행사에서 회사는 “AI로 구동되는 완전히 새로운 모바일 경험”을 약속합니다.

ChatGPTMidjourney 등이 촉발한 AI 과대광고에 발을 담그는 것은 삼성이 처음이 아닐 것입니다. 두 스마트폰 실리콘 대기업인 Qualcomm과 MediaTek은 최근 최신 플래그십 및 미드레인지 프로세서의 온디바이스 생성 AI 기능에 대해 큰 성과를 거두었습니다.

변화는 분명합니다. AI는 휴대폰 마케팅의 화두가 될 것입니다. 그런데 우리가 정확히 무엇을 위해 있는 걸까요? 이러한 소위 "AI 발전"이 어떻게 의미 있는 가치를 추가할 것인지는 비밀로 남아 있습니다. 아니면 다른 이름이나 기본 앱으로 다시 패키징되기를 기다리는 기존 트릭일 수도 있습니다.

삼성은 상품을 배송하거나 극적으로 흔들릴 수 있습니다

삼성 갤럭시 AI 티저.
이것은 속임수가 아닌 것이 좋습니다, 삼성. 삼성

Galaxy S24 시리즈 휴대폰부터 시작하겠습니다. Qualcomm의 Snapdragon 8 Gen 3 칩 과 함께 배송될 예정입니다. 칩 제조업체는 새로운 최상위 칩셋의 생성 AI 기능에 대해 대담한 주장을 하고 있습니다. 예를 들어 Stable Diffusion AI 기술을 사용하면 1초 안에 텍스트 프롬프트에서 이미지를 생성한다고 합니다.

Qualcomm은 온디바이스 작동을 위해 Stable Diffusion 기술을 어떻게 최적화했는지에 대한 흥미로운 기술적 설명을 제공했습니다. 라이벌 MediaTek은 또한 주력 제품인 Dimensity 9300 의 온디바이스 AI 기능을 통해 Stable Diffusion을 통해 1초도 안 되는 시간에 텍스트-이미지 생성이 가능하다고 주장합니다.

현재 우리는 이미 Qualcomm의 최신 주력 제품을 탑재한 휴대폰을 보유하고 있습니다. 문제의 장치는 iQoo 12 이지만 휴대폰의 마케팅 자료에는 생성 AI 트릭, 특히 Qualcomm과 MediaTek이 과장하는 종류의 기술이 언급되어 있지 않다는 점이 흥미롭습니다.

삼성이 텍스트를 이미지로 변환하는 기능을 제공할 운명이라고 가정해 보겠습니다. 결국에는 무엇을 성취하게 될까요? 현재로서는 텍스트를 이미지로 변환하는 기술이 타사 앱에 번들로 제공될지 아니면 삼성이 해당 앱 중 하나에 통합할지 알 수 없습니다.

진짜 질문은 이것이 우리의 일상적인 스마트폰 사용 패턴에 얼마나 많은 가치를 추가할 것인가입니다. 평균적인 Galaxy S24 구매자는 한 줄의 텍스트 프롬프트로 생성된 이미지로 무엇을 하게 될까요? 아마도 그들은 AI가 생성한 이미지를 사용하여 채팅에 재미를 더하거나 소셜 미디어에서 입소문을 낼 것입니다.

그러나 여기에는 여전히 약간의 마찰이 있습니다. 텍스트 줄에서 이러한 이미지를 생성하고 로컬에 저장한 다음(또는 클립보드에 직접 복사한 다음) 해당 AI 이미지를 선택한 채팅 앱에 붙여넣어야 합니다. 가장 최적의 솔루션은 삼성이 키보드에 이미지를 텍스트로 변환하는 기술을 어떻게든 통합하는 것입니다.

Qualcomm의 휴대폰용 Stable Diffusion 데모.
퀄컴

다시 한 번 말씀드리지만, 이모티콘, GIF, 스티커만으로 충분할 수 있는데 왜 이 모든 어려움을 겪어야 합니까? 또한 512 x 512 픽셀의 출력은 이러한 AI 생성 이미지를 대학 과제나 업무 프레젠테이션에 넣기에는 해상도가 충분하지 않습니다.

게다가 시스템은 무료가 아닐 가능성이 높습니다. MediaTek의 데모 비디오에서는 프리미엄 옵션이 테이블에 있다고 언급합니다. Galaxy S24 구매자는 특정 출력 수에 도달하면 텍스트-이미지 토큰에 대한 제한에 직면하게 될 수 있으며, 그 후에는 더 느린 이미지 생성 속도 계층으로 다운그레이드되거나 구독료를 지불하라는 요청을 받을 수 있습니다.

그러나 그것이 현실이라면 OpenAI의 Dall-E 와 같은 솔루션이 이미 존재하기 때문에 요점은 불분명합니다. 무료로 이미지를 생성하거나 ChatGPT Plus 에 대한 비용을 지불하여 최신 Dall-E 3 모델로 더 빠르고 상세한 이미지 생성 혜택을 누릴 수 있습니다. 이는 시중에 나와 있는 수많은 텍스트-이미지 생성기 중 하나일 뿐입니다.

Qualcomm은 Snapdragon 8 Gen 3가 "멀티모달 Gen AI 모델을 지원하는 최초의 제품"이라고 밝혔습니다. 즉, 휴대폰에서 기본적으로 실행되는 챗봇(Meta의 Llama 모델 기반)이 음성은 물론 텍스트와 이미지 형식의 입력을 받아들인다는 의미입니다. 다시 한번 말하지만, 이는 구독 벽 뒤에 있지만 ChatGPT-4가 이미 해당 기능을 제공하고 있기 때문에 고유한 것은 아닙니다.

정말 필요한가요?

휴대폰의 Snapdragon AI 도우미.
퀄컴

퀄컴이 광고하는 가장 유망한 기능 중 하나는 AI 이미지 확장이다. 기본적으로 이미지의 캔버스를 원하는 방향으로 확장할 수 있으며, 기기에 내장된 생성 AI가 텍스트 프롬프트를 기반으로 지능적으로 픽셀을 생성하고 원본 프레임에 더 많은 개체를 추가합니다.

이 트릭을 목격하는 것은 놀랍습니다. 더 많은 물체를 추가하면 이미지가 확장되고, 마치 화가가 자신의 작품을 리터치하는 것처럼 지평선이 넓어지는 것을 볼 수 있습니다. 하지만 휴대폰에서 사진을 클릭하여 추억으로 저장하고 싶지는 않을 것입니다. 생성적 AI 확장을 사용하는 것은 실제로 경험하지 못한 가짜 비주얼과 시나리오로 기억을 오염시키는 것과 같습니다.

요약은 휴대폰에 온디바이스 생성 AI를 배포하기 위한 또 다른 큰 선택입니다. 뉴스를 읽고 다양한 분야의 최신 개발 상황을 파악하는 데 좋습니다. 그러나 이 트릭은 마찰이 최소화된 경우에만 눈에 띕니다. 예를 들어 사용자가 다른 앱을 열지 않고 동일한 브라우저 페이지에서 뉴스 기사를 요약할 수 있는 경우입니다.

후자의 경우 이미 해당 기능을 수행하는 앱으로 전환하면 어떨까요? 예를 들어, Artifact는 AI를 사용하여 기사를 요약하는 Instagram 공동 창립자 Kevin Systrom이 훌륭하게 디자인한 앱입니다 .

Inshorts와 같이 요약된 너겟 형태로 뉴스를 제공하는 앱과 웹사이트가 이미 있습니다. 받은 편지함의 경우, Shortwave는 추가 비용 없이 이메일 체인을 요약하는 것 이상의 작업을 수행할 수 있는 탁월한 앱입니다 .

Shortwave로 이메일 요약 보내기
Shortwave와 같은 앱은 이메일 체인을 요약하는 데 적합합니다. Nadeem Sarwar / 디지털 트렌드

온디바이스 생성 AI는 음성 기반 사진 편집과 같은 기능도 제공합니다. 놀랍도록 편리한 것처럼 들리지만 원탭 필터와 세분화된 슬라이더가 휴대폰에서 미디어를 편집할 때 똑같이 빠르고 보람 있는 흐름을 제공한다면 그것이 우리 삶에 얼마나 편리함을 더해줄 것인지 상상하기 어렵습니다.

다음으로, 일반적인 채팅을 진행하거나 인터넷 기반 연구가 필요한 답변을 얻기 위해 AI를 사용하는 것과 관련된 기본 상황으로 이동해 보겠습니다. 이번에도 질적인 문제에 부딪히게 됩니다.

Meta의 Llama와 같이 휴대폰에서 기본적으로 실행되는 생성 AI 모델은 리소스의 근본적인 가용성으로 인해 가장 발전된 모델은 아닙니다. Google보다 더 이상 보지 마십시오. Pixel 8 Pro는 Gemini Nano라는 Google의 대규모 언어 모델 중 가장 작은 모델만 실행합니다 . 능력이 떨어지는 언어 모델에 안주하는 대신 전용 모바일 앱을 통해 ChatGPT 또는 Pi와 같은 것으로 넘어가는 것은 어떨까요?

생성 AI가 실제로 필요한 곳

ChatGPT와 AI 비서 비교.
Nadeem Sarwar / 디지털 트렌드

현재 생성 AI가 최선을 다하는 부분은 클라우드에서 스마트폰 작업을 분리하고(항상 온라인 상태여야 함) 추가적인 보안을 제공하는 것입니다. 하지만 그러기 위해서는 이러한 온디바이스 AI 트릭이 Google 어시스턴트, Alexa 또는 Siri와 같은 보조자 역할도 해야 합니다.

아니면 더 나은 방법은 보조자의 일부가 되어야 한다는 것입니다. 생성 AI 비서에게 라이브러리에서 모든 고양이 이미지를 선택하여 콜라주로 엮은 다음 아빠에게 보내라고 지시하세요. 또는 디즈니랜드 당일 여행을 위한 최적의 일정을 계획하도록 요청하고, 다음 주말에 가장 저렴한 티켓을 찾고, 모든 세부정보를 Google 캘린더에 깔끔하게 정리하세요.

더욱이, 기기 내 생성 AI 도구가 더 이상 데이터를 클라우드 서버에 푸시하지 않고 모든 작업을 스마트폰에 로컬로 유지한다면 데이터 개인 정보 보호에 대해 걱정할 필요가 거의 없습니다. 적어도 이론적으로는 그렇습니다. 현재로서는 삼성이 판매하는 갤럭시 AI 비전에 대해 확신할 수 없지만, 삼성이 진정으로 의미 있는 생성 AI 경험을 제공할 수 있는지, 아니면 거의 실용적이지 않고 변칙적인 트릭을 제공할 수 있는지 보는 것은 흥미로울 것입니다.


게시됨

카테고리

작성자

태그: