목록으로
AI앱플레이스테크1

ChatGPT Images 2.0 출시 — 이미지 생성 AI가 이제 생성 전에 "생각"한다

'꽃 어디' 앱 아이콘

Flower Where

꽃구경 명소를 찾는 가장 쉬운 방법
'꽃 어디' 지금 설치하세요

ChatGPT Images 2.0 출시 — 이미지 생성 AI가 이제 생성 전에 "생각"한다

#ChatGPT #OpenAI #이미지생성AI #AI이미지 #gptimage2

4월 21일 OpenAI가 ChatGPT Images 2.0을 공식 출시했습니다. 단순한 버전 업그레이드가 아닙니다. 이번 모델은 이미지를 생성하기 전에 추론을 거칩니다. 웹 검색도 합니다. 프롬프트 하나로 최대 8장의 연속된 이미지를 일관된 캐릭터와 스타일로 뽑아낼 수 있습니다. OpenAI의 표현을 빌리자면, "이미지 생성 도구"에서 "시각적 사고 파트너"로의 전환입니다.

가장 큰 변화 — Thinking 모드

이번 업데이트의 핵심은 추론 기반 생성입니다.

Thinking 모드는 더 느리고 신중한 방식으로 작동합니다. 시각적 결과물을 생성하기 전에 먼저 추론을 거치는 방식으로, 여러 장면에 걸쳐 캐릭터 일관성을 유지하고 연속적인 서사를 담은 이미지를 만들 수 있습니다. 이 기능은 만화, 스토리보드, 멀티씬 디자인 같은 작업에 새로운 가능성을 엽니다.

Thinking 모드에서는 단일 프롬프트로 최대 8장의 이미지를 한 번에 생성할 수 있으며, 캐릭터·오브젝트·스타일이 모든 장면에 걸쳐 일관성 있게 유지됩니다. 한 장의 사진과 텍스트 프롬프트로 여러 페이지의 만화를 만들거나, 연속된 SNS 카드 그래픽이나 여러 방의 인테리어 계획을 한 번에 뽑는 것이 가능합니다.

이전 이미지 모델들의 가장 큰 약점이 장면 간 일관성이었다는 점을 감안하면, 이는 의미 있는 도약입니다.

두 가지 모드 — Instant와 Thinking

모든 사용자는 기본 이미지 모델에 접근할 수 있으며, Thinking 모드는 유료 구독자용으로 제공됩니다. 새 모델은 API를 통해 개발자들도 이용할 수 있습니다.

구체적으로 정리하면 이렇습니다. 무료 사용자 포함 모든 ChatGPT·Codex 사용자는 즉시 Instant 모드에 접근 가능합니다. Plus·Pro 사용자는 Thinking 기능 — 도구 사용, 웹 검색, 멀티 이미지 생성 — 에 접근할 수 있으며, Pro 사용자는 추가로 'ImageGen Pro' 모델을 이용할 수 있습니다.

단, Thinking 모드는 그만큼 시간이 걸립니다. 추가적인 추론 과정으로 인해 이미지 생성에 더 오랜 시간이 소요될 수 있습니다. 복잡한 만화 여러 장을 만들 때도 몇 분이면 된다고 OpenAI는 설명합니다.

텍스트 렌더링이 달라졌다

AI 이미지 생성의 오랜 약점은 텍스트였습니다. 불과 2년 전에는 멕시코 음식 메뉴를 만들면 'enchuita', 'churiros', 'burrto' 같은 존재하지 않는 단어들이 등장했습니다.

이제 ChatGPT Images 2.0에 같은 요청을 하면 식당에서 즉시 사용할 수 있는 수준의 메뉴판이 나옵니다.

한국어를 비롯한 비라틴 문자 지원도 주목할 만합니다. Images 2.0은 일본어·한국어·중국어·힌디어·벵골어에서 고품질 텍스트 생성을 지원하는 "다국어 모델"로 설계됐습니다. 텍스트가 단순히 번역되는 것이 아니라 레이아웃 안에서 자연스럽게 통합되도록 처리됩니다.

무엇을 만들 수 있나

이번 업데이트는 지시 사항 따르기 개선, 텍스트 렌더링 강화, 오브젝트 배치 향상, 다양한 형식과 언어 지원 확대에 초점을 맞췄습니다. 순수한 시각적 실험 도구가 아니라 디자인, 교육, 개발, 콘텐츠 제작 워크플로우에서 바로 쓸 수 있는 결과물을 만들기 위한 시스템으로 포지셔닝된 것입니다.

실제 활용 가능한 사례들을 보면, 잡지 표지, 인포그래픽, 교육 자료, SNS 카드, UI 목업, 프레젠테이션 슬라이드, 만화/망가 등입니다. 비율은 3:1 초광폭부터 1:3 초세로까지 지원합니다.

API 스펙 — 개발자는 이렇게 쓴다

API 모델명은 gpt-image-2입니다. 해상도는 API를 통해 최대 2K(베타)까지 지원되며, 비율도 유연하게 설정할 수 있습니다. 가격은 이미지 입력 토큰 100만 개당 $8, 출력 토큰 100만 개당 $30입니다. 텍스트 토큰은 입력 $5, 출력 $10입니다.

기존 GPT-Image-1.5는 레거시 지원으로 API에서 계속 이용할 수 있지만 기본 모델에서는 내려갑니다.

경쟁 맥락 — Google Nano Banana와의 싸움

ChatGPT Images 2.0은 Google의 Nano Banana Pro와 같은 핵심 역량을 공유합니다. 생성 전에 "생각"하고, 선택한 모드에 따라 추론에 더 많거나 적은 시간을 들이며, 그 과정에서 웹 검색도 할 수 있습니다.

OpenAI는 이 모델이 자체적으로 어떤 바이럴 이미지를 만들어낼지 예측할 수 없다고 했습니다. AI 모델의 선두 자리는 새 모델이 금방 따라잡거나 앞서나가면서 오래 유지되지 않는 경향이 있습니다. 구글은 지난해 Nano Banana로 큰 주목을 받았고, OpenAI는 그보다 몇 달 전 더 뛰어난 모델로 스튜디오 지브리 스타일 이미지가 크게 퍼졌습니다.

이번 Images 2.0으로 OpenAI가 다시 주도권을 가져올 수 있는지가 관건입니다.

"이미지는 장식이 아니라 언어다"

이번 발표에서 OpenAI가 가장 강조한 문구입니다. "이미지는 언어이지 장식이 아닙니다. 좋은 이미지는 좋은 문장처럼 선택하고, 배열하고, 드러냅니다. 메커니즘을 설명하고, 분위기를 연출하고, 아이디어를 테스트하고, 논거를 만들 수 있습니다."

단순히 "예쁜 그림 만드는 AI"에서 벗어나, 실제 업무 흐름에 통합되는 시각 언어 시스템이 되겠다는 선언입니다. 추론 기능이 이미지 생성에 붙은 것은 텍스트 AI의 발전 경로를 이미지 생성이 그대로 따르고 있다는 신호이기도 합니다.

참고 출처: OpenAI 공식 발표 (2026.04.21) / TechCrunch, Images 2.0 상세 리뷰 / VentureBeat, 기능 및 멀티링구얼 분석 / The Decoder, 기술 분석 / Axios, 모드별 접근 정리 / Interesting Engineering, 2K 해상도 상세

0

댓글 (0)

댓글을 불러오는 중...