그동안 'AI 에이전트'라는 말, 솔직히 좀 지겹게 들었잖아요? 막상 써보면 말귀 못 알아먹어서 내가 직접 하는 게 빠르겠다 싶을 때도 많았고요. 그런데 오늘 발표된 GPT-5.3-Codex는 결이 좀 다르더라고요. 이건 단순히 코드를 짜주는 도구가 아니라, 진짜 옆자리에 앉은 꽤 일 잘하는 동료 느낌이거든요. (드디어 말귀 통하는 녀석이 왔나 싶네요.)
- 속도는 25% 빨라졌는데, 추론 능력은 GPT-5.2급으로 올라왔어요.
- 컴퓨터 조작 능력(OSWorld)이 기존 38%에서 64.7%로 수직 상승했더라고요.
- 협업 기능 강화! 중간에 개입해서 방향 틀어도 문맥 안 놓치고 따라와요.
단순한 모델이 아니라 '에이전트'라 부르는 이유
가장 소름 돋는 지점은 이 모델이 '자기 자신을 만드는 데 직접 참여'했다는 거예요. 오픈AI 팀이 GPT-5.3-Codex 초기 버전을 써서 자기 모델의 버그를 잡고 배포까지 관리했대요. (이제 AI가 스스로를 업그레이드하는 시대가 진짜 온 거죠.) 단순히 코드 한 줄 던져주는 게 아니라, 연구부터 도구 사용, 복잡한 실행까지 긴 호흡의 작업을 알아서 해냅니다.
비약적으로 상승한 컴퓨터 사용 능력 (OSWorld)
데이터로 보면 더 확실해요. OSWorld라는 벤치마크가 있는데, 이게 시각적인 데스크톱 환경에서 작업을 얼마나 잘 수행하나 보는 거거든요. 기존 GPT-5.2가 38% 정도였는데, 이번 5.3-Codex는 64.7%를 찍었습니다. 사람이 보통 72% 정도 나온다는데, 이제 거의 사람 턱밑까지 쫓아왔다고 봐도 무방해요. (이제 엑셀 만지거나 슬라이드 만드는 건 얘한테 다 맡겨도 되겠더라고요.)
웹 개발, 이제 알아서 눈치껏 다 합니다
개발자분들은 공감하실 텐데, '적당히 알아서' 해주는 게 제일 어렵잖아요? 5.3-Codex는 의도 파악 능력이 진짜 좋아졌어요. 예전 같으면 랜딩 페이지 만들 때 가격표를 일일이 계산해서 넣어야 했다면, 이제는 "연간 플랜 할인 보여줘"라고만 해도 알아서 월별 할인 가격으로 계산해서 깔끔하게 띄워줍니다. (이런 디테일이 생산성 차이를 만드는 거 아시죠?)
보안까지 신경 쓴 '똑똑한 방패'
이번 모델은 사이버 보안 능력에서도 'High' 등급을 받았대요. 취약점을 직접 찾아내도록 훈련받은 첫 번째 모델이라는데, 오픈소스 프로젝트인 Next.js의 취약점을 실제로 찾아내기도 했고요. 방어자들에게는 엄청난 우군이 생긴 셈이죠. (물론 악용될까 봐 오픈AI 측에서 보안 가드레일을 엄청 빡빡하게 세워뒀다고 하니 그나마 안심이네요.)
자주 묻는 질문 (FAQ)
이제 AI는 도구를 넘어 협업자로 진화하고 있어요. "이거 짜줘"가 아니라 "이런 방향으로 같이 가보자"가 가능해진 거죠. 지금 당장 IDE나 CLI 켜서 한마디 건네보세요. 생각보다 훨씬 놀라운 경험을 하시게 될 겁니다. 전 벌써 다음 주 프로젝트가 기대되네요!
이 글이 도움 되셨나요?
더 궁금한 점은 댓글로 남겨주세요. 제가 아는 선에서 최대한 답변 드릴게요!
면책조항: 본 포스팅은 기술적 정보 공유를 목적으로 하며, 실제 모델의 성능은 개별 사용 환경과 프롬프트에 따라 달라질 수 있습니다. 최신 업데이트 사항은 공식 홈페이지를 참고하시기 바랍니다.