국제 경제
오픈AI, 'GPT-5.4' 공개…추론·코딩 통합한 차세대 AI 모델
- 컴퓨터 직접 제어하는 에이전트 기능 첫 탑재
오픈AI는 최상위 AI 모델의 개선판인 'GPT-5.4'와 'GPT-5.4 프로'를 5일(현지시간) 선보였다.
이 모델은 이전에 영역별로 'GPT-5.2 사고(Thinking)'와 'GPT-5.3-코덱스' 등으로 나뉘어 있던 모델을 하나로 통합한 것이 특징이다.
또 이용자의 컴퓨터를 직접 조작해 여러 애플리케이션을 넘나들며 복잡한 작업을 수행할 수 있는 '컴퓨터 제어' 에이전트 기능도 자사 범용 모델 가운데 처음으로 탑재했다.
한 번에 처리할 수 있는 데이터양도 최대 100만 토큰(AI 모델의 입출력 단위)으로 늘려 AI 에이전트가 긴 안목의 계획을 수립하고 실행할 수 있도록 했다.
GPT-5.4 프로 모델은 44개 직종의 지식 업무 수행 능력을 평가하는 "GDPval' 성능지표(벤치마크)에서 82%를 기록해 70% 수준이었던 전작을 뛰어넘었다.
또 정보검색 능력을 측정하는 '브라우즈컴프' 지표에서도 89.3%로 경쟁작인 구글 제미나이3.1 프로(85.9%)나 앤트로픽 클로드 오퍼스 4.6(84%)보다 점수가 높았다.
코딩 능력을 재는 'SWE-벤치 프로 퍼블릭' 지표에서는 GPT-5.4가 57.7%를 받았는데, 이는 제미나이3.1 프로(54.2%)를 상회하는 점수다.
다만 오픈AI는 지금껏 코딩 능력 평가 기준으로 삼아왔던 'SWE-벤치 베리파이드' 지표는 공개하지 않았다. 오픈AI는 이 지표가 AI 훈련 데이터 등에 노출돼 결과가 오염됐기 때문이라고 설명했다.
'SWE-벤치 베리파이드'에서는 지금까지 클로드 오퍼스 4.6이 가장 높은 점수를 유지해오고 있었다.
이날 공개된 GPT-5.4 모델은 챗GPT 유로 가입자들에게 즉시 제공되며, 기존 모델인 'GPT-5.2 사고' 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지






![생닭 버무린 손으로 키보드를?... 조회수 1715만 터진 뇌절 요리사 [김지혜의 ★튜브]](https://isp.edailystatic.com/data/isp/image/2026/05/25/isp20260525000055.400.0.png)
![[단독] ‘제2의 곽튜브’ 꿈꾸는 이자반 “전 여자친구와 이별로 유튜브 시작… 반지하서 성공 일기 쓸 것” [IS인터뷰]](https://isp.edailystatic.com/data/isp/image/2026/05/11/isp20260511000046.400.0.jpg)
당신이 좋아할 만한 기사
브랜드 미디어
브랜드 미디어
손정의의 프랑스 베팅…"AI 패권 새 거점" vs "장밋빛 청사진"(종합)
세상을 올바르게,세상을 따뜻하게일간스포츠
일간스포츠
이데일리
박나래 前남친, 개인정보 무단 제공 의혹 벗었다…경찰 "증거 불충분"
대한민국 스포츠·연예의 살아있는 역사 일간스포츠일간스포츠
일간스포츠
일간스포츠
반도체 호황에 ‘깜짝 성장’…가계소득은 제자리
세상을 올바르게,세상을 따뜻하게이데일리
이데일리
이데일리
국민연금 국내주식 20.8%로 높인다…하락장에선 방어수단 되나[마켓인]
성공 투자의 동반자마켓인
마켓인
마켓인
"마일스톤 불확실성 줄였다"...GC녹십자, 큐레보 매각 주목받는 이유
바이오 성공 투자, 1%를 위한 길라잡이팜이데일리
팜이데일리
팜이데일리