Siri, Cortana, Google Assistant 등 AI 도우미는 한동안 스마트폰에 존재해 왔습니다. 그리고 모든 영역에서 인공 지능 기술이 급속히 발전함에 따라 이러한 보조자는 시간이 지날수록 더 좋아질 것입니다.
이에 대한 첫 번째 예는 Android 스마트폰의 Google Assistant를 기본 AI 도우미로 대체한 Google의 Gemini입니다. 이전 Gemini는 Google Assistant에 비해 수행할 수 있는 작업이 상당히 제한되어 있었지만 Google은 최근 챗봇을 믿을 수 없을 만큼 강력하고 유용하게 만드는 주요 업데이트를 발표했습니다.
지난 1월 Pixel 8 휴대폰과 Samsung Galaxy S24에서 발표된 Gemini Nano의 경우 특히 그렇습니다. Google이 이 모델을 더욱 개선하기 위해 업데이트할 계획은 다음과 같습니다.
Gemini의 상황 인식이 크게 향상되고 있습니다.
다른 챗봇과 마찬가지로 Gemini는 일반적으로 사용자가 상호 작용하는 맥락을 이해할 수 있지만 항상 그런 것은 아닙니다. 그렇기 때문에 앞으로 다가올 가장 중요한 변화 중 하나는 상황 인식 기능이 크게 향상된다는 것입니다.
이제 Gemini는 화면에서 무슨 일이 일어나고 있는지, 심지어 특정 시간에 사용하고 있는 애플리케이션까지 쉽게 이해할 수 있습니다. Google에 따르면 사용자는 동시에 다른 앱을 사용하는 동안 Gemini 오버레이를 불러오고 AI를 사용할 수 있습니다. 예를 들어 Gemini로 이미지를 생성하고 Google 메시지, Gmail 또는 다른 앱으로 직접 끌어서 놓을 수 있습니다.
또 다른 예는 YouTube 비디오를 시청할 때 Gemini의 ‘비디오에 질문하기’ 기능을 사용하여 해당 비디오에서 정보를 얻을 수 있다는 것입니다. 이는 PDF를 완전히 읽지 않고도 PDF에서 빠르게 정보를 얻을 수 있도록 도와주는 Gemini Advanced의 ‘PDF에 질문하기’ 기능과 유사합니다.
마지막으로 Gemini가 화면을 확인하여 제공하는 동적 제안이 있습니다. Gemini는 귀하가 작업 중인 모든 내용의 맥락을 자동으로 이해하므로 아무것도 입력하지 않고도 이러한 일이 발생할 수 있습니다.
예를 들어, Google 메시지에서 커피 한잔하러 가는 것에 관해 대화를 나누고 있는 경우 Gemini는 자동으로 Google 지도에서 가까운 최고의 커피숍을 추천할 수 있습니다.
사용자는 결과를 제공하는 동안에도 표시되는 오버레이 패널에서 Gemini에 곧 액세스할 수 있으므로 매번 전체 화면 모드로 열 필요가 없습니다.
Gemini Nano, 완전한 다중 모드 기능 확보
지금까지 Gemini는 사용자의 질문을 이해하고 관련 답변을 제공하기 위해 텍스트 또는 음성 기반 입력에 의존했습니다. 이제 Google은 기능을 업그레이드하고 이를 Multimodality를 갖춘 Gemini Nano라고 부릅니다. 업데이트된 모델은 사용자가 원하는 것을 이해하기 위해 시각적, 음성 언어, 소리도 사용할 수 있기 때문입니다.
이는 거대하지만 매우 환영받는 업그레이드이며 AI 비서가 탑재된 스마트폰이 수행할 수 있는 작업을 크게 변화시킬 것입니다. 텍스트에만 의존하는 대신 Pixel 스마트폰을 사용하여 카메라와 마이크를 통해 주변 정보를 얻을 수 있습니다.
학생들을 돕기 위해 검색 서클이 업데이트되었습니다.
지난 1월, Google은 일부 Android 스마트폰을 위한 새로운 기능인 Circle To Search를 발표했습니다. 이 기능을 사용하면 사용 중인 앱을 종료하지 않고도 간단한 동작을 사용하여 정보를 검색할 수 있습니다. 이는 다중 검색과 함께 작동하므로 이미지와 텍스트를 모두 사용하여 화면에 있는 모든 것에 대해 Google에 질문할 수 있습니다.
Circle To Launch는 출시 이후 전체 화면 번역과 같은 기능으로 업데이트되었지만 I/O 개발자 컨퍼런스에서 Google은 또 다른 업데이트를 발표했습니다. 이제 학생들이 수학 및 물리 문제를 쉽게 풀 수 있도록 도와 숙제를 도와줄 수 있습니다.
학생들은 도움이 필요한 문제에 동그라미를 치면 됩니다. 그러면 Gemini는 답을 얻기 위해 따라야 할 단계를 제공할 것입니다.
Google은 또한 Circle To Search가 곧 그래프, 다이어그램, 수식 등과 관련된 복잡한 문제를 해결하는 데 도움을 줄 것이라고 발표했습니다. 구글은 또한 이 기능을 더 많은 픽셀과 삼성 스마트폰으로 확대하고 있다.
Talkback은 더 나은 설명을 제공합니다
Talkback은 시각 장애가 있는 사람들의 스마트폰 화면에 표시되는 내용을 설명하여 도움을 주기 위해 설계된 Android 기능입니다. Gemini Nano가 다중 모드 기능을 확보하면서 Talkback은 개체와 요소를 설명하는 데에도 훨씬 더 나은 기능을 제공하고 있습니다.
가장 인상적인 점은 기기가 오프라인일 때도 작동한다는 것입니다. 업데이트된 Gemini Nano 모델은 인간이 제공하는 것과 매우 유사한 설명을 제공할 수 있으므로 현재 Talkback이 작동하는 방식에 비해 훨씬 더 유용합니다.
Gemini는 이제 사기 전화에 대해 경고할 수 있습니다.
사기 방지가 수년에 걸쳐 더욱 강력해짐에 따라 사기 전화도 더욱 정교해졌습니다. 따라서 이러한 보호 조치에도 불구하고 많은 사람들은 여전히 사기 전화와 진짜 전화를 구별하지 못합니다. 이것이 바로 Google이 Gemini Nano가 사기 방지를 위한 실시간 경고를 제공할 수 있는 새로운 기능을 테스트하는 이유입니다.
일반적으로 사기 전화에 나타나는 대화 패턴을 감지하여 즉시 경고할 수 있습니다. 예를 들어, 은행 담당자라고 주장하는 사람으로부터 자금 이체나 이와 유사한 것을 요청하는 전화를 받으면 경고를 받게 됩니다. 그리고 이는 기기 내 보호이므로 귀하의 개인정보가 침해되지 않습니다.
Gemini Nano는 올해 초 Pixel 8 휴대폰 시리즈와 Samsung Galaxy S24에 출시되었습니다. 업데이트된 모델은 올해 말 Pixel 휴대폰에 출시될 예정이며, 사기 전화 알림과 같은 기능은 모든 Android 기기에 적용될 예정입니다.
이러한 업데이트를 통해 Google은 필요할 때마다 도움을 줄 수 있는 가상 비서로서 Gemini를 더욱 강력하고 효과적으로 만들고 있습니다. 그러나 이러한 기능의 대부분은 적어도 현재로서는 플래그십 휴대폰으로 제한되므로 다른 장치에서 볼 수 있으려면 다소 기다려야 할 수도 있습니다.
답글 남기기