국제 경제
오픈AI, 'GPT-5.4' 공개…추론·코딩 통합한 차세대 AI 모델
- 컴퓨터 직접 제어하는 에이전트 기능 첫 탑재
오픈AI는 최상위 AI 모델의 개선판인 'GPT-5.4'와 'GPT-5.4 프로'를 5일(현지시간) 선보였다.
이 모델은 이전에 영역별로 'GPT-5.2 사고(Thinking)'와 'GPT-5.3-코덱스' 등으로 나뉘어 있던 모델을 하나로 통합한 것이 특징이다.
또 이용자의 컴퓨터를 직접 조작해 여러 애플리케이션을 넘나들며 복잡한 작업을 수행할 수 있는 '컴퓨터 제어' 에이전트 기능도 자사 범용 모델 가운데 처음으로 탑재했다.
한 번에 처리할 수 있는 데이터양도 최대 100만 토큰(AI 모델의 입출력 단위)으로 늘려 AI 에이전트가 긴 안목의 계획을 수립하고 실행할 수 있도록 했다.
GPT-5.4 프로 모델은 44개 직종의 지식 업무 수행 능력을 평가하는 "GDPval' 성능지표(벤치마크)에서 82%를 기록해 70% 수준이었던 전작을 뛰어넘었다.
또 정보검색 능력을 측정하는 '브라우즈컴프' 지표에서도 89.3%로 경쟁작인 구글 제미나이3.1 프로(85.9%)나 앤트로픽 클로드 오퍼스 4.6(84%)보다 점수가 높았다.
코딩 능력을 재는 'SWE-벤치 프로 퍼블릭' 지표에서는 GPT-5.4가 57.7%를 받았는데, 이는 제미나이3.1 프로(54.2%)를 상회하는 점수다.
다만 오픈AI는 지금껏 코딩 능력 평가 기준으로 삼아왔던 'SWE-벤치 베리파이드' 지표는 공개하지 않았다. 오픈AI는 이 지표가 AI 훈련 데이터 등에 노출돼 결과가 오염됐기 때문이라고 설명했다.
'SWE-벤치 베리파이드'에서는 지금까지 클로드 오퍼스 4.6이 가장 높은 점수를 유지해오고 있었다.
이날 공개된 GPT-5.4 모델은 챗GPT 유로 가입자들에게 즉시 제공되며, 기존 모델인 'GPT-5.2 사고' 모델은 3개월간 유지된 이후 오는 6월 5일 서비스를 종료할 예정이다.
ⓒ이코노미스트(https://economist.co.kr) '내일을 위한 경제뉴스 이코노미스트' 무단 전재 및 재배포 금지






![산적 같은 비주얼로 드럼 치는 남자를 아시나요 [김지혜의 ★튜브]](https://image.isplus.com/data/isp/image/2026/03/30/isp20260330000057.400.0.png)
![“오빠, 나 이러려고 만나?”... 한 번쯤은 공감했을 ‘그냥 필름’ [김지혜의 ★튜브]](https://image.isplus.com/data/isp/image/2026/03/03/isp20260303000042.400.0.jpg)
당신이 좋아할 만한 기사
브랜드 미디어
브랜드 미디어
트럼프 “F-15 탑승자 이란서 구조…美군사 우위 또 입증”(상보)
세상을 올바르게,세상을 따뜻하게일간스포츠
일간스포츠
이데일리
손흥민, 39분 만에 커리어 첫 ‘도움 4개 폭발’→5골 관여…시즌 10경기 11AS
대한민국 스포츠·연예의 살아있는 역사 일간스포츠일간스포츠
일간스포츠
일간스포츠
트럼프, 이란에 또 48시간 최후통첩…“이번엔 진짜” vs “타코 어게인”
세상을 올바르게,세상을 따뜻하게이데일리
이데일리
이데일리
[마켓인]‘완전자본잠식’ 과천 지타운…넷마블, 중동발 공사비 리스크에 ‘촉각’
성공 투자의 동반자마켓인
마켓인
마켓인
"현직 피부과 의사가 직접 만든 피부미용의료기기기업"[아그네스메디컬 대해부①]
바이오 성공 투자, 1%를 위한 길라잡이팜이데일리
팜이데일리
팜이데일리