
2026년 구글 I/O AI 핵심 총정리: 제미나이 3.5 플래시, 엔티그래비티 2.0 심층 분석
AI 에이전트 시대, 구글의 야심 찬 전략과 개발 환경의 혁신을 파헤치다
⚡ 핵심 요약
- •구글 제미나이 3.5 플래시, 이전 모델 능가하는 성능에도 출력 토큰 가격 3배 인상 논란
- •엔티그래비티 2.0, 에이전트 중심 개발 환경으로 전환하며 '홈페이지 만들어 줘' 명령만으로 코딩 가능
- •제미나이 스파크, Gmail, 캘린더 등 구글 앱과 연동해 개인화된 AI 에이전트 서비스 제공 (월 100달러)
- •제미나이 옴니, 'Anything-to-Anything' 비전 제시하며 영상 생성 등 멀티모달 AI의 새 지평 열어
2026년 5월 29일, 구글 I/O에서 발표된 AI 기술은 단순한 업그레이드를 넘어 산업 전반의 패러다임 전환을 예고했습니다. 특히 '에이전트 중심' 개발 환경으로의 변화와 'Anything-to-Anything' 모델의 등장은 AI가 우리 일상과 비즈니스에 얼마나 깊숙이 침투할지 가늠하게 합니다. 이번 발표는 구글이 방대한 컴퓨팅 파워를 바탕으로 AI 시대를 어떻게 선도하려 하는지 그 청사진을 명확히 보여줍니다.
제미나이 3.5 플래시: 성능과 가격, 두 얼굴의 진실
구글은 새로운 AI 모델인 제미나이 3.5 플래시를 공개하며, 이전 최강 모델인 제미나이 3.1 프로의 벤치마크 점수를 대부분의 영역에서 뛰어넘는 성능을 자랑했습니다. 특히 출력 속도가 빠르면서도 높은 지능을 유지해 '가성비 모델'이라는 평가를 받았습니다. 그러나 문제는 가격 정책에 있습니다. 플래시 모델임에도 불구하고 이전 제미나이 3 플래시 대비 출력 토큰 가격이 3배가량 비싸졌고, 심지어 제미나이 3.1 프로보다도 특정 작업에서 더 높은 비용이 발생한다는 비판이 터져 나왔습니다. 한 사용자는 “3.5 플래시는 핵빠른 멍충이”라며 성능 대비 아쉬움을 토로했습니다. 멀티모달 이해 벤치마크에서는 강점을 보였지만, '플래시'라는 이름이 주는 기대와 달리 비용 부담이 커진 점은 구글의 가격 전략에 대한 의문을 남깁니다.
구글 엔티그래비티 2.0: 에이전트, 개발의 중심에 서다
개발 환경의 혁신은 구글 엔티그래비티 2.0에서 가장 두드러집니다. 기존의 VS 코드 같은 통합 개발 환경(IDE)이 아닌, 에이전트 상호작용을 위한 독립형 데스크톱 애플리케이션으로 UI가 완전히 바뀌었습니다. 이제 개발자는 코드 편집기 대신 에이전트에게 작업을 지시하는 창을 메인으로 사용합니다. “홈페이지를 만들어 줘”와 같은 명령으로 프로젝트를 생성하고 코딩할 수 있게 된 것입니다. 하네스 기능은 12배 빨라졌고, 제미나이 CLI는 엔티그래비티 CLI로 대체될 예정입니다. 구글은 93개의 하위 에이전트를 활용해 12시간 만에 운영 체제의 핵심 프레임워크를 구축하고 둠(Doom) 게임을 실행하는 데모를 선보이며, 에이전트 중심 개발 환경의 강력한 잠재력을 입증했습니다. 하지만 한 사용자는 “안티그레비티에서 제미나이를 이용해서 코딩 해보면 욕 나올 때가 한두 번이 아니네요. 특히나 stub 코드 남발을 하고 사용자 지시 사항 불이행이 너무 심하더군요”라고 지적하며 아직 개선할 부분이 많다는 점을 시사했습니다.
제미나이 API의 확장: 관리형 에이전트와 스파크의 등장
구글은 제미나이 API에 관리형 에이전트 기능을 도입하여 사용자가 API 호출 한 번으로 리눅스 기반의 에이전트를 빌려 쓸 수 있게 했습니다. 이는 클라우드 인프라를 활용한 구글의 강점을 명확히 보여주는 대목입니다. 더 나아가 제미나이 스파크는 오픈 클로(OpenClaw)나 헤르메스 에이전트 같은 에이전트를 구글 클라우드 위에서 간편하게 실행할 수 있는 기능입니다. 이메일 답장, 캘린더 등록, 엑셀 시트 생성 등 Gmail, 캘린더, 드라이브, 포토, 유튜브 등 구글 앱들과 연동되어 개인화된 작업을 AI 에이전트가 수행합니다. 기존 에이전트 설치 및 관리의 번거로움을 해소하며, 월 100달러의 울트라 요금제부터 이용 가능합니다. 현재는 미국에서 먼저 출시되었고, 향후 한국에도 도입될 예정입니다. 이는 AI 에이전트가 개인 비서처럼 일상에 깊숙이 들어오는 시대를 예고합니다.
제미나이 옴니: 'Anything-to-Anything' 모델, AGI를 향한 발걸음
구글이 공개한 제미나이 옴니 모델은 'Anything-to-Anything'이라는 비전을 제시하며 멀티모달 AI의 궁극적인 목표를 향해 나아갑니다. 텍스트, 이미지, 오디오, 영상 등 어떤 형태의 입력값이든 받아들여 텍스트, 이미지, 오디오, 영상 등 원하는 모든 형태의 결과물을 만들어낼 수 있는 모델을 의미합니다. 첫 번째 단계로 공개된 제미나이 옴니 플래시 비디오 모델은 기존에 불가능했던 영상 자체를 변형하고 생성하는 기술을 선보였습니다. 팟캐스트 영상을 변형하거나, 3D 이미지 경로에 따라 택시가 운전하는 POV 영상을 생성하는 등 혁신적인 영상 생성 능력을 보여주었습니다. 이는 범용 인공지능(AGI)을 향한 중요한 단계로 평가되며, 멀티모달 AI 분야에서 구글의 압도적인 기술력을 다시 한번 입증하는 계기가 되었습니다. 구글은 이처럼 방대한 컴퓨팅 파워를 기반으로 모든 제품 영역에 제미나이를 통합하며 AI 시대를 선도하려는 강력한 의지를 드러내고 있습니다.
마무리: 구글 AI, 일상과 산업의 미래를 그리다
구글 I/O 2024는 AI 기술 발전의 방향과 구글의 야심 찬 전략을 명확히 보여주었습니다. 제미나이 3.5 플래시는 인상적인 성능을 보여주었지만, 가격 정책에 대한 논란은 '가성비' 모델로서의 정체성에 의문을 제기합니다. 반면, 구글 엔티그래비티 2.0은 개발 환경을 에이전트 중심으로 전환하며 AI 기반 개발의 새로운 표준을 제시했고, 제미나이 API의 관리형 에이전트와 스파크는 개인화된 AI 에이전트 서비스의 대중화를 예고합니다. 특히, 제미나이 옴니의 'Anything-to-Anything' 비전은 멀티모달 AI의 궁극적인 목표를 제시하며 AGI를 향한 구글의 도전을 보여주었습니다. 구글은 방대한 컴퓨팅 파워를 기반으로 AI 기술이 일상과 산업 전반에 더욱 깊숙이 침투할 것임을 시사하며, AI 시대의 리더십을 공고히 하려는 강력한 의지를 드러냈습니다.
심층 분석
SSOKTUBE 에디터의 전문 해설
🌐 배경 맥락
인공지능 기술은 2010년대 중반 딥러닝의 부상 이후 빠르게 발전해왔습니다. 특히 2022년 말 GPT-3.5의 등장은 일반 대중에게 AI의 잠재력을 각인시키며 '생성형 AI' 시대를 본격적으로 열었습니다. 이후 AI 모델들은 단순한 텍스트 생성을 넘어 이미지, 오디오, 영상 등 다양한 형태의 데이터를 이해하고 생성하는 '멀티모달' 기능으로 확장되었습니다. 구글은 이러한 흐름 속에서 제미나이 시리즈를 통해 멀티모달 AI 분야의 선두 주자로 자리매김하려 노력해왔습니다. 이번 2026년 I/O 발표는 이러한 노력의 정점을 보여주며, AI가 단순한 도구를 넘어 인간의 업무 방식과 창작 활동 전반을 재정의하는 '에이전트'로 진화하고 있음을 시사합니다. 특히 구글의 방대한 클라우드 인프라와 데이터는 이러한 AI 에이전트의 학습과 확장에 필수적인 기반을 제공하며, AI 기술이 더 이상 특정 전문가의 영역이 아닌, 모든 이의 일상이 되는 미래를 그리고 있습니다. 현재 AI 기술 트렌드는 크게 세 가지로 요약됩니다. 첫째, **경량화 및 효율화**: 제미나이 3.5 플래시처럼 빠른 응답 속도와 낮은 리소스 소모를 목표로 하는 모델들이 등장하며, 모바일 기기나 엣지 컴퓨팅 환경에서의 AI 활용이 가속화되고 있습니다. 둘째, **에이전트화**: AI가 단순한 질문-답변을 넘어 복잡한 작업을 스스로 계획하고 실행하는 '에이전트' 형태로 진화하며, 개발 환경부터 사용자 인터페이스까지 전반적인 변화를 이끌고 있습니다. 셋째, **멀티모달리티의 확장**: 텍스트, 이미지, 오디오를 넘어 영상까지 아우르는 'Anything-to-Anything' 모델의 등장은 AI가 현실 세계를 더욱 깊이 이해하고 상호작용할 수 있게 하며, AGI 구현에 한 발 더 다가서게 합니다. 이러한 트렌드는 AI가 특정 산업에 국한되지 않고 모든 분야에 걸쳐 혁신을 주도할 것임을 보여줍니다.
📚 핵심 개념 강의노트
1제미나이 3.5 플래시 (Gemini 3.5 Flash)
제미나이 3.5 플래시는 구글의 최신 경량 AI 모델로, 속도와 효율성에 중점을 둡니다. 이 모델은 이전 버전인 제미나이 3.1 프로보다 대부분의 벤치마크에서 뛰어난 성능을 보이며, 특히 멀티모달 이해 능력에서 강점을 가집니다. 하지만 '플래시'라는 이름에도 불구하고 이전 플래시 모델 대비 출력 토큰 가격이 3배가량 상승하여 비용 효율성에 대한 논란이 있습니다. 이는 개발자들이 빠른 속도와 높은 지능 사이에서 비용을 고려해야 하는 새로운 과제를 안겨주며, 구글이 고성능 AI 모델의 접근성을 어떻게 조절하려 하는지 보여주는 지표입니다. 예를 들어, 대규모 데이터 처리나 실시간 응답이 필요한 애플리케이션에서는 여전히 매력적인 선택지가 될 수 있습니다.
2엔티그래비티 2.0 (Antigravity 2.0)
엔티그래비티 2.0은 구글이 제시하는 AI 시대의 새로운 개발 환경입니다. 기존의 통합 개발 환경(IDE)이 코드 작성에 집중했다면, 엔티그래비티 2.0은 '에이전트 중심'의 개발을 지향합니다. 즉, 개발자가 직접 코드를 작성하기보다 AI 에이전트에게 작업을 지시하고, 에이전트가 코드를 생성하고 수정하는 방식입니다. 이는 마치 숙련된 팀원에게 프로젝트를 맡기듯, 자연어 명령으로 복잡한 개발 작업을 수행할 수 있게 합니다. 구글은 93개의 하위 에이전트를 활용하여 12시간 만에 운영체제 프레임워크를 구축하는 데모를 통해 그 잠재력을 입증했습니다. 이는 개발 생산성을 혁신적으로 높이고, 비전문가도 코딩에 참여할 수 있는 가능성을 열어줍니다. 그러나 아직은 에이전트의 지시 불이행이나 'stub 코드 남발'과 같은 문제점이 지적되며, AI의 '지시 이해' 능력이 더욱 고도화되어야 함을 보여줍니다.
3제미나이 옴니 (Gemini Omni) 및 Anything-to-Anything 모델
제미나이 옴니는 구글의 'Anything-to-Anything' 모델 비전을 대표하는 핵심 개념입니다. 이는 텍스트, 이미지, 오디오, 영상 등 어떤 형태의 입력값이든 받아들여, 다시 텍스트, 이미지, 오디오, 영상 등 원하는 모든 형태의 결과물을 만들어낼 수 있는 궁극적인 멀티모달 AI 모델을 의미합니다. 기존 AI 모델들이 특정 모달리티(예: 텍스트-텍스트, 이미지-텍스트)에 국한되었다면, 제미나이 옴니는 모달리티 간의 장벽을 허물어 진정한 의미의 '이해'와 '생성'을 목표로 합니다. 예를 들어, 영상의 특정 부분을 편집하거나, 3D 경로에 맞춰 새로운 영상을 생성하는 등, 인간의 인지 능력에 가까운 복합적인 작업을 수행합니다. 이는 범용 인공지능(AGI)을 향한 구글의 중요한 발걸음으로, 콘텐츠 제작, 교육, 의료 등 다양한 산업 분야에 혁명적인 변화를 가져올 잠재력을 가집니다.
🎯 오늘 당장 실천하는 단계별 가이드
**구글 클라우드 AI 플랫폼 탐색**: 구글 클라우드 계정을 생성하고, 제미나이 API 및 엔티그래비티 2.0의 개발자 도구를 탐색하여 AI 에이전트 개발 환경을 직접 경험해 보세요. 초기 무료 크레딧을 활용하면 비용 부담 없이 시작할 수 있습니다.
**개인화된 AI 에이전트 실험**: 제미나이 스파크가 출시되면, Gmail, 캘린더 등 자신의 구글 앱과 연동하여 이메일 자동 답장, 일정 관리, 문서 요약 등 개인화된 AI 에이전트 기능을 직접 설정하고 활용해 보세요. 이를 통해 일상 업무 효율을 높일 수 있습니다.
**멀티모달 AI 콘텐츠 제작 시도**: 제미나이 옴니 플래시 비디오 모델과 같은 멀티모달 AI 도구를 활용하여 간단한 영상 편집, 이미지 생성, 오디오 변환 등 새로운 형태의 콘텐츠 제작을 시도해 보세요. AI가 제공하는 창의적 가능성을 직접 경험할 수 있습니다.
**AI 커뮤니티 참여 및 정보 교환**: 조코딩 채널과 같은 AI 전문 유튜브 채널을 구독하고, 관련 온라인 커뮤니티에 참여하여 최신 AI 트렌드와 기술 활용 팁을 공유하고 배우세요. 다른 개발자나 사용자들의 경험을 통해 실질적인 인사이트를 얻을 수 있습니다.
자주 묻는 질문
시청자 반응
🔥 인기 댓글 경향
구글 제미나이와 엔티그래비티 2.0에 대한 사용자들의 반응은 성능과 비용 측면에서 극명하게 엇갈립니다. 특히 제미나이 3.5 플래시의 지능 수준과 엔티그래비티의 토큰 소모량에 대한 불만이 많으며, 경쟁 모델인 GPT나 클로드에 비해 아직 부족하다는 의견이 지배적입니다. 하지만 일부 사용자들은 엔티그래비티의 속도 향상과 기업용 제미나이의 성장 가능성을 긍정적으로 평가하기도 합니다.
[👍14] 안티그레비티 에서 제미나이를 이용해서 코딩 해보면 욕 나올때가 한두번이 아니네요 특히나 stub 코드 남발을 하고 사용자 지시 사항 불이행이 너무 심하더군요 거기다 요금제도 안티그래비티 초기 외 다르게 토큰 소모량이 많아 졌는지 또는 토큰 한도를 낮춘건지 요금제로 욕먹는 타사 제품 못지 않게 토큰 소모가 금방 되더군요 울트라 요금제(36만원) 사용 하다
♥ 14[👍11] 3개 다 쓰는데, 3.5 플래시는 핵빠른 멍충이...? 프로도 수준이 처참하면 많이 실망스러울 듯
♥ 11[👍7] gpt,claude가 신입사원이면 제미나이는 초딩 같음. 너무 안따름. 에이전트용으로는 사용할 수 없을 듯
♥ 7[👍5] 구글 안 될듯 맥아리가 없네. 잡기술로만 겉 도는 거 같다. 지금 클로드, 코덱스도 완벽하다고 생각하지 않는데 못 넘으면 핵심이 밀린다고 봐야하나.
♥ 5[👍4] 이전플래쉬는 무제한이었음 지금은 안티그래비티에서 사라짐 한도 다쓰면 손놓고 있어야됨 무제한 막을려고 급하게 패치한것도 있음 좋아졌다는건 구글 입장이고 지금 플래시는 미친듯이 바보짓함 문맥관리 안되서 3.1 프로쓰고있음
♥ 4💬 최근 댓글 경향
최신 댓글에서도 구글 AI 제품들의 통합성과 사용자 경험에 대한 아쉬움이 제기됩니다. 특히 여러 구글 AI 서비스들이 각자 잘 만들어졌지만, 서로 묶어 쓰기 어렵다는 지적이 많습니다. 그럼에도 불구하고 학습용이나 가벼운 작업용으로는 제미나이와 엔티그래비티가 쓸만하다는 긍정적인 평가도 일부 보입니다. 중국산 AI에 대한 보안 우려도 언급되었습니다.
[👍0] 아니 노트북LM, 안티그래비티, 제미나이, 구글API 다 각자는 잘 만들어놓고 묶어쓰기 너무 힘들어.. 뭐하자는건지 모르겠음..
[👍0] 학습용으로는 제미나이 쓸만해요
[👍0] 중국산 ai는 싸면 뭐함?? 백도어로 내 신상 정보 다 빼가는데?? 신상 털릴 일 있음?? 신상 정보 주의한다고 해도.. 나도 모르게 하나 하나 조금씩 말하는 거 모으면.. 다 털리게 되는 거임.. 이런 주의점 없이 소개하면.. 친중임?
[👍1] 안티그래비티 사용해봤는데 생각보다 엄청 빨라서 좋더라고요. 물론 정확도는 클로드 코드나 코덱스에 비하면 많이 떨어지지만 리뷰를 통해서 수정해 나가면 되서 당분간 가벼운 작업은 안티그래비티를 통해서 할것같습니다.
♥ 1[👍0] Antigravity cli를 vs code에서 클로드 코덱스와 같이 활용해봤는데 나쁘지않은듯
이 포스트에 포함된 영상 (1개)
댓글
첫 번째 댓글을 남겨보세요!
