2026년 5월 28일, Anthropic이 Claude Opus 4.8을 업데이트 했습니다. 같은 날 공개된 블로그 포스트에는 성능 벤치마크 표도 있었지만 더 눈에 띄는 것이 있었습니다. Cursor, Devin, 법률 AI, 금융 AI 담당자들의 실무 후기였습니다.
블로그에 공개된 그 실무 후기들은 다음과 같습니다.
- “에이전트 작업에서 더 신뢰할 수 있다”
- “스스로 실수를 잡아낸다”
- “긴 세션에서 스타일과 맥락을 유지한다”
모델이 얼마나 똑똑해졌는지가 아니라 실제 업무에서 어떻게 쓰이는지를 이야기하고 있었습니다.
ChatGPT도 마찬가지입니다. 최근 한 달 업데이트를 보면 수학·과학 인터랙티브 학습 모듈, 노력 수준 조절 기능, mini 모델로의 접근성 확대가 핵심입니다. 더 점수가 높은 모델이 아니라 더 잘 쓰이는 제품을 만들고 있습니다.
이번 글은 그 변화를 정리한 글이며, 아래 공식 블로그 글을 참고하였습니다.
출처 : Introducing Claude Opus 4.8
1. 달라진 AI 업데이트 방식
2023년 ChatGPT가 처음 등장한 시점부터 2025년까지는, Gemini, Claude, Grok 등 대부분은 아래 평가 기준으로 경쟁했습니다.
- 파라티머 투사 더 많다!
- 벤치마크 점수가 더 높다.
- GPT가 Claude 보다 더 높다 등
성능 자체가 차별점이었습니다.
그런데 2026년 지금은 다릅니다. GPT-5, Claude 4, Gemini 3가 출시된 시점에서 일반 사용자가 모델 간 성능 차이를 체감하기 어려워졌습니다. 상향 평준화가 일어났습니다.
(1) 업데이트 빈도에서 시작

상단의 스크린샷에서 보신 것처럼 Claude 블로그는 1~2일 간격으로 새 글이 올라옵니다. 5월 27일, 28일에만 3개의 글이 동시에 올라왔습니다.
May 28, 2026 : Introducing dynamic workflows in Claude CodeMay 27, 2026 : Using LLMs to secure source codeMay 27, 2026 : How CodeRabbit used Claude to build an agent orchestration system
이건 모델 출시 공지가 아닙니다. 실무 활용 사례, 개발자 가이드, 기능 업데이트입니다. 전형적인 SaaS 릴리즈 노트 방식입니다.
(2) 바뀐 이유 추론
이렇게 바뀐 이유를 테크뷰 관점에서 추론해보면 다음과 같습니다.
2023년부터 2025년 하반기까지는 LLM 성능 경쟁의 시대였습니다.
차별점은 모델의 지능이나 성능, 즉, 중학교 수준, 대학교, 박사 수준 등 혹은 SAT 점수처럼 지능 자체를 높이는 것이 중요했습니다. 이는 많은 학습 비용이 소요되며 수개월 단위로 업데이트 시간이 소요되었습니다. 주로 벤치마크 점수로 표시되곤 했었죠.
하지만 이제는 그 성능 자체를 사람이 체감하기가 어려워졌습니다. 상향 평준화 되었기 때문입니다.
그보다는 이제는 실무에서 얼마나 더 잘 사용할 수 있고, 그 효용감을 느끼는 지에 있습니다. 업데이트 주기는 한 달에서 빠르면 매주 단위로 일어납니다. 마치 SaaS에서 매달 기능 노트를 발표하듯, 공지되고 있습니다.
성능이 비슷해진 상황에서 사용자가 체감하는 차이는 기능과 경험에서 납니다.
그래서 두 회사 모두 실무 현장에서 즉각 쓸 수 있는 기능 업데이트에 집중하고 있습니다. 마치 Slack이나 Notion이 매주 기능을 업데이트하는 방식과 같습니다.
2. Opus 4.8 업데이트
Opus 4.8 버전은 유료 사용자라면 오늘부터 바로 사용할 수 있었습니다. 아래 글은 블로그와 업데이트 내용을 확인하여 정리한 사항입니다.

(1) Opus 4.8의 핵심 사항
Opus 4.8에서 가장 두드러진 개선은 정직함이라고 합니다.
Opus 4.8은 불확실성을 표시할 가능성이 더 높고 근거 없는 주장을 할 가능성이 낮습니다. 평가에서 Opus 4.8은 전 모델보다 약 4배 덜 자신이 작성한 코드의 결함을 발견하여 사용자에게 알린다고 합니다.
이게 왜 중요한가 하면 에이전트가 실수를 덮고 진행하는 것이 실무에서 가장 큰 리스크이기 때문입니다.
기존 모델의 문제→ 작업 중 오류 발생→ 모델이 이를 인식하지 못하고 계속 진행→ 나중에 발견하면 전체 작업 재시작Opus 4.8→ 오류 발생 시 스스로 플래그→ 불확실한 부분을 먼저 사용자에게 알림→ Devin CEO : "Opus 4.8은 4.6의 댓글 장황함과 툴 호출 문제를 수정해 자율 엔지니어링 워크플로우에 필요한 일관성을 제공한다"
(2) Dynamic Workflows
Claude Code에서 사용 가능한 Dynamic Workflows는 Claude가 작업을 계획하고 단일 세션에서 수백 개의 병렬 서브에이전트를 실행할 수 있게 합니다. 출력물을 검증한 후에 우리에게 보고하여 확인 받는 절차를 거칩니다.
쉽게 말하면 다음과 같습니다.
기존 Claude Code→ Claude 1개가 순서대로 작업→ 대규모 코드베이스는 시간이 오래 걸림Dynamic Workflows→ Claude가 작업을 잘게 나눠 수백 개 서브에이전트 배분→ 동시에 처리 후 결과 취합·검증→ 수십만 줄 코드 마이그레이션을 킥오프부터 머지까지 자동 완료
현재 이 버전은 Claude Code Enterprise, Team, Max 플랜에서 리서치 프리뷰로 제공되고 있습니다.
(3) Effort Control
가장 SaaS다운 업데이트입니다. 슬랙의 알림 설정처럼 Claude가 얼마나 깊이 생각할지를 사용자가 직접 선택할 수 있게 됐습니다.
높은 노력 설정(higher effort settings)에서는 Claude가 더 자주 더 깊이 생각해서 더 나은 응답을 제공합니다. 낮은 노력 설정에서는 더 빠르게 응답하고 토큰 등 사용량을 더 천천히 소비하게 됩니다.
즉, 다음과 같은 설정 옵션을 제공합니다.
Effort 설정 옵션→ Low : 빠른 답변, 사용량 절약→ High : 기본값, 품질과 속도 균형→ Extra : 어려운 작업, 긴 비동기 워크플로우→ Max : 최고 품질, 토큰 많이 사용실무 활용 예시→ 간단한 이메일 초안 : Low→ 일반 코딩 작업 : High→ 복잡한 리서치 : Extra→ 중요한 계약서 검토 : Max
모델을 선택하는 것과 별개로 같은 모델을 상황에 맞게 조절해서 쓸 수 있는 구조입니다. 비용과 품질을 사용자가 직접 트레이드오프할 수 있게 된 것입니다.
3. ChatGPT 최근 업데이트(5월)
OpenAI의 방향은 Claude와 명확히 다릅니다.
Claude가 개발자와 기업 에이전트 신뢰도에 집중했다면 ChatGPT는 더 많은 사람의 일상 깊숙이 파고드는 방향입니다.
(1) Codex 코딩 도구
5월 21일 업데이트에서 Codex가 대폭 강화됐습니다.

Goal Mode 정식 출시→ 원하는 결과와 성공 기준을 정의→ Codex가 목표를 향해 자율 작업 지속→ Codex 앱, IDE 확장, CLI 전체 지원잠금 상태에서도 원격 작업→ Mac이 잠겨도 Codex가 계속 실행→ 모바일에서 진행 상황 확인 및 방향 수정 가능Appshots→ 핫키 하나로 앱 창을 스크린샷 + 텍스트째 Codex에 첨부→ 긴 설명 없이 화면 그대로 맥락 전달
핵심은 개발자가 자리를 비워도 Codex가 계속 일한다는 것입니다. Claude의 Dynamic Workflows와 같은 방향이지만 접근법이 다릅니다. Claude는 서버 에이전트, ChatGPT Codex는 내 Mac과 모바일을 연결하는 방식입니다.
(2) 개인 재정 관리
5월 15일 출시된 가장 파격적인 업데이트입니다.
ChatGPT Finances (미국 Pro 사용자 대상)→ Plaid로 금융 계좌 직접 연결→ 지출, 청구서, 구독, 순자산, 투자 한 화면에서 확인→ 내 재정 데이터 기반으로 직접 질문 가능
예를 들어 다음과 같은 질문을 던질 수 있다고 합니다.
- “이번 달 고정비가 얼마야?”
- “구독 중에 안 쓰는 게 뭐야?”
- “저축 목표 달성하려면 얼마 줄여야 해?”
다만 명확한 한계도 공식 선언했습니다. 돈을 이동시키거나 청구서를 납부하거나 투자 자문은 하지 않습니다. AI가 분석과 계획을 돕되 실행은 사람이 하는 구조입니다.
(3) Excel, Google Sheets 통합
5월 5일 전 세계 출시됐습니다.
Microsoft Excel, Google Sheets 사이드바에 ChatGPT 탑재→ 스프레드시트 안에서 직접 AI 사용→ 수식 생성, 다중 탭 파일, 예산, 시나리오 분석→ Free, Go, Plus, Pro 모두 사용 가능 (요금제별 사용량 한도 차이)
이건 단순한 기능 추가가 아닙니다. Excel과 Sheets가 AI 도구가 되는 것입니다. 우리가 이미 매일 쓰는 툴 안으로 ChatGPT가 들어오는 방식입니다.
4. 업데이트 정리
2가지 대표 솔루션은 비슷한듯 조금 다른 방향으로 집중하고 있습니다.
Claude가 에이전트 중심으로 대규모 작업을 수행하면서, 신뢰감을 높이는 데에 집중했다면,
ChatGPT는 사람들이 이미 사용하는 곳에 얼마나 더 자연스럽게 포함시키는 지에 집중하고 있었습니다.
이 모든 변화가 가리키는 방향이 하나 있습니다. 과거에는 얼마나 AI가 똑똑한가에 집중했다면, 이제는 얼마나 우리 일에 더 깊숙하게 들어와서 함께 일할 수 있는가에 집중하고 있습니다.
모델 성능이 상향 평준화된 시점에서 차별점은 생태계와 통합으로 넘어갑니다. Excel을 매일 쓰는 팀이라면 ChatGPT 통합이 결정적 이유가 됩니다. Claude Code로 대규모 코드베이스를 운영하는 개발팀이라면 Dynamic Workflows가 중요한 선택 이유가 될 것 입니다.
오늘 소개한 업데이트 외에도 최근 테크뷰에서는 구글 프로젝트 지니, 몰트봇, Genspark AI 등 다양한 솔루션을 소개해드리고 있는데요.
아래 테크뷰 홈페이지를 통해 많은 관심 부탁드리겠습니다.

함께 읽기 좋은 글
마누스 AI(Manus) 주요 기능 및 사용 후기(ft. Meta 인수)
클로드 코워크 사용 방법 및 주요 기능 정리: 플러그인 11종 공개
몰트봇 Moltbot 사용 방법 및 비용, 중요 이슈 점검 (ft. 클로드봇)
Genspark AI 어디까지 가능할까? (ft. 사용 후기 및 신규 기능 AI 시트)
GPT 5.1 업데이트 및 Siri – Gemini 통합 임박 : 최신 AI 키워드 보기
Claude Skills – AI 업무 혁신의 시작
AI 에이전트 대전환 – AWS 베드록 에이전트코어, Salesforce, OpenAI





댓글 남기기