제미나이 3.5 프로, 6월엔 정말 나올까

구글이 5월 I/O 무대에서 제미나이 3.5 프로(Gemini 3.5 Pro)를 공개해 놓고도, 정작 손에 쥐여주진 않았습니다. 순다르 피차이가 무대에서 “다음 달까지만 기다려 달라”고 말하자 객석에서 한숨 섞인 반응이 터져 나왔다는 후문이 돌 정도였습니다. 그 “다음 달”이 바로 지금, 6월입니다.

같은 자리에서 발표된 제미나이 3.5 플래시(Flash)는 5월 19일 곧바로 풀렸지만, 상위 모델인 프로는 아직 버텍스(Vertex)의 제한적 프리뷰에 머물러 있습니다. 정식 출시(GA)는 6월 중으로만 못 박혀 있고 정확한 날짜는 없습니다. 그렇다면 이번 달 안에 정말 나오는 걸까요? 그리고 나온다면 클로드·GPT를 넘어설 만한가요?

먼저 풀린 플래시의 성능을 단서로 삼으면, 프로가 어디쯤 착지할지 어느 정도 가늠이 됩니다. 이번 글에서는 발표된 사양과 벤치마크, 예상 가격을 정리하고 마지막에 개인적인 전망도 덧붙이겠습니다.

제미나이 3.5 프로 - Google Gemini 3.5 Pro AI model abstract concept, glowing blue and multicolor neural network, futuristic clea... — (사진: mindstudio.ai)

제미나이 3.5 프로, 지금 어디까지 왔나

제미나이 3.5 프로는 5월 19일 구글 I/O 2026에서 플래시와 함께 발표됐습니다. 그런데 당일 실제로 배포된 건 플래시뿐이었고, 프로는 일부 개발자만 쓸 수 있는 버텍스 제한 프리뷰 상태로 남았습니다. 피차이의 “다음 달까지 기다려 달라”는 발언이 곧 6월 GA를 의미하는 셈인데, 구체적인 날짜는 끝내 나오지 않았습니다.

제미나이 3.5 프로 - large context window visualization, streams of text tokens flowing into an AI core, deep reasoning concept, ... — (사진: dreamstime.com)

구글의 과거 패턴을 보면 정식 출시 때는 한 번에 여러 채널로 동시 배포하는 편입니다. 플래시도 5월 19일 발표와 동시에 앱·API·버텍스에 일제히 풀렸습니다. 그래서 프로 역시 GA 시점이 오면 하루 만에 모든 창구에서 쓸 수 있을 가능성이 큽니다. 다만 “6월”이라는 표현만 있을 뿐 1주 차인지 말일인지조차 불투명해, WWDC(6월 8일)나 여름 신작 발표 일정 사이에서 묻힐 위험도 있습니다.

2M 토큰과 Deep Think, 무엇이 달라지나

발표 기준으로 제미나이 3.5 프로의 핵심은 두 가지입니다. 하나는 200만(2M) 토큰에 이르는 컨텍스트 윈도, 다른 하나는 ‘Deep Think’로 불리는 심층 추론입니다. 과거 제미나이 울트라가 맡던 프런티어급 멀티모달 영역을 이번 프로가 흡수하는 그림입니다.

특히 추론 과정(chain)을 개발자가 직접 들여다볼 수 있게 공개한다는 점이 눈에 띕니다. 클로드의 확장 사고나 o3 계열의 추론 트레이스와 비슷한 방향인데, 필요하면 추론에 쓰는 연산량을 예산처럼 제한할 수도 있다고 합니다. 긴 문서를 통째로 넣고 정확히 짚어내는 ‘needle-in-haystack’ 성능도 한층 강해졌다는 설명입니다. 1.5M 토큰을 내세운 GPT-5.6의 초장문 컨텍스트와 정면으로 부딪치는 지점입니다.

플래시가 먼저 보여준 성능

프로의 실력을 가늠하려면 먼저 풀린 플래시를 보는 게 빠릅니다. 제미나이 3.5 플래시는 구버전인 3.1 프로보다 코딩·에이전트 벤치마크에서 앞서면서도 4배 빠르고 비용은 약 40% 낮다고 구글은 밝혔습니다. 하위 모델이 직전 상위 모델을 추월한 셈이라, 새 프로의 천장이 어디일지 기대를 키웁니다.

코딩·에이전트 벤치마크 점수

구체적으로 플래시는 Terminal-Bench 2.1에서 76.2%, MCP Atlas 83.6%, SWE-bench Verified 78%를 기록했습니다. 외부 비교에서는 MCP 기반 워크플로와 범용 도구 사용에서 GPT-5.5·클로드 Opus 4.7을 앞섰고, 반대로 터미널 코딩과 컴퓨터 제어는 GPT-5.5가, 대규모 저장소 코딩(SWE-Bench Pro)은 Opus 4.7이 우위였습니다. 한 모델이 전부 이기는 시대는 지났다는 걸 다시 확인시켜 줍니다. 모델별 최신 사양은 구글 딥마인드 제미나이 공식 페이지에서 확인할 수 있습니다.

추론 성능의 약점

흥미로운 건 플래시가 어려운 추론에서는 살짝 뒷걸음쳤다는 평가입니다. 바로 그 약점을 메우라고 만든 게 Deep Think를 단 프로일 텐데, 솔직히 이 부분은 직접 써보기 전까진 반신반의하게 됩니다.

가격은 얼마나 될까

가격은 GA 때 확정될 예정이라 아직 공식 수치는 없습니다. 다만 업계에서는 프로가 플래시의 약 10배 비율을 따른다는 전례를 들어, 입력 100만 토큰당 약 15달러, 출력 약 60달러 선을 점칩니다. 이는 클로드 Sonnet 계열과 경쟁하고 GPT-5.5 프로보다는 아래에 놓이는 구간입니다.

제미나이 3.5 프로 - AI model performance comparison concept, benchmark bars and data charts on dark dashboard, modern tech illus... — (사진: google.com)

참고로 먼저 공개된 제미나이 3.5(플래시)는 입력 100만 토큰당 1.5달러, 출력 9달러 수준으로 알려졌습니다. 작년 같은 등급보다 단가가 오른 흐름이라, 프로 가격이 공개되면 “성능 대비 값어치”를 두고 또 한 번 논쟁이 벌어질 듯합니다. 가격에 민감한 팀이라면 I/O 2026에서 공개된 제미나이 3.5 라인업을 다시 짚어보고 플래시로 충분한지부터 따져보는 게 합리적입니다.

솔직한 전망

출시 시점은 6월 후반일까

개인적으로는 6월 안에 나오긴 하되, 월 후반으로 밀릴 가능성이 높다고 봅니다. WWDC와 여름 게임·신작 발표가 몰린 6월 초중순을 구글이 일부러 피할 이유가 충분하기 때문입니다. 작년에도 구글은 큰 행사가 겹치는 주를 비켜 조용히 모델을 푸는 모습을 몇 번 보였습니다.

성능 면에서는 플래시가 이미 직전 프로를 넘어선 만큼, 3.5 프로가 GPQA·ARC 같은 고난도 추론 지표에서 클로드·GPT 최상위 모델과 한 자릿수 차이로 붙는 그림이 그려집니다. 다만 한 가지 의문은 남습니다. 컨텍스트 2M, 추론 공개, 멀티모달까지 다 좋은데, 정작 일반 사용자가 체감하는 응답 속도와 안정성이 받쳐줄까 하는 점입니다. 1년 후를 내다보면 결국 승부는 벤치 점수보다 ‘실사용에서 얼마나 덜 헛소리하느냐’로 갈릴 것 같습니다.

실사용에서 봐야 할 포인트

온디바이스 쪽 변화도 함께 보면 그림이 더 또렷해집니다. 애플이 시리에 외부 모델을 끼워 넣는 방향을 잡은 만큼, iOS 27에서 제미나이를 골라 쓰는 선택지가 현실화되면 3.5 프로의 존재감은 더 커질 수 있습니다. 일단은 6월 GA 공지를 기다리며, 가격표가 뜨는 순간 플래시와 한 번 더 저울질해보길 권합니다.

정식 출시 날짜와 최종 가격은 구글 공식 발표로 확정되는 만큼, 도입 결정 전에는 반드시 공식 채널의 최신 공지를 확인하시기 바랍니다.

제미나이 3.5 프로의 출시 소식과 가격이 공개되는 대로 가장 먼저 비교 분석을 전해드리겠습니다. 최신 AI 모델 소식이 궁금하다면 NERD LOG를 즐겨찾기에 추가하고 다음 글에서 다시 만나요.