Anthropic이 2026년 5월 28일 Claude Opus 4.8을 공개했다. Opus 4.7이 나온 지 그리 오래되지 않은 시점이지만, 이번 릴리스는 단순한 마이너 패치로 보기 어렵다. 코드 결함 감지 능력이 이전 모델 대비 약 4배 향상됐고, Fast Mode 가격은 3배 가량 낮아졌으며, Effort Control이라는 새로운 제어 메커니즘이 API 수준에서 도입됐다.
이번 릴리스에서 가장 눈에 띄는 개념은 Effort Control이다. 사용자가 응답에 투입할 노력 수준을 “높음”과 “낮음” 중에서 선택할 수 있다. 언뜻 단순해 보이지만 실무에서 함의하는 바가 적지 않다. 지금까지 LLM 기반 시스템은 모든 요청을 같은 깊이로 처리하거나, 사용자가 프롬프트 안에 “간단하게” 같은 지시를 명시적으로 넣어야 했다. Effort Control은 이 조절을 API 파라미터 레벨로 끌어올린다. 단순 조회와 심층 추론 작업을 같은 모델 안에서 구분 처리할 수 있게 되면서, 비용과 응답 시간을 워크로드 성격에 맞게 최적화할 수 있는 여지가 생겼다.
코드 분야의 개선은 수치로 뒷받침된다. Anthropic에 따르면 Opus 4.8은 코드 결함 감지 능력에서 이전 모델 대비 약 4배 우수한 결과를 보였다. 버그나 취약점을 찾아내는 작업에서 이 정도 차이라면 코드 리뷰 자동화나 보안 감사 파이프라인에서 실질적인 차이를 만들 수 있다. Online-Mind2Web 벤치마크에서는 84%를 기록했고, Legal Agent Benchmark에서는 해당 벤치마크 역사상 처음으로 10% 이상 달성률을 보인 모델로 이름을 올렸다. 10%라는 숫자가 낮아 보일 수 있지만, 법률 에이전트 벤치마크가 요구하는 추론의 복잡도를 감안하면 이 수치가 얼마나 어렵게 달성된 것인지 가늠할 수 있다.
Opus 4.8 주요 수치
공개 발표 기준 — 코드 결함 감지는 이전 모델 대비 상대 배수
수백 개 병렬 서브에이전트와 수십만 줄 코드 마이그레이션
Dynamic Workflows 지원도 이번 릴리스의 핵심이다. Claude Code에서 단일 세션 안에 수백 개의 병렬 서브에이전트를 실행할 수 있게 됐다. 이전에는 대규모 코드베이스 마이그레이션을 진행할 때 작업을 여러 세션으로 나누거나, 외부 오케스트레이션 레이어를 별도로 구축해야 했다. 수십만 줄 규모의 코드 마이그레이션을 단일 세션에서 처리한다는 것은 에이전트가 전체 컨텍스트를 유지한 채로 일관된 판단을 내릴 수 있다는 의미다. 부분 리팩토링에서 생기는 맥락 단절 문제를 줄이는 데 직접적인 효과를 기대할 수 있다.
Messages API도 함께 업그레이드됐다. 메시지 배열 내에 시스템 항목을 직접 배치할 수 있게 됐고, 프롬프트 캐시를 유지한 상태로 지침을 업데이트하는 것도 가능해졌다. 캐시 무효화 없이 시스템 지침을 교체할 수 있다는 것은, 대화 중간에 컨텍스트 전환이 필요한 복잡한 에이전트 파이프라인에서 유용하다. 예를 들어 동일한 캐시된 긴 문서를 참조하면서 태스크별로 다른 역할 지침을 적용하는 멀티스텝 워크플로우에서 토큰 비용을 아낄 수 있다.
Fast Mode, 이전 대비 3배 저렴해진 속도
가격 구조를 보면, 기본 API 요금은 Opus 4.7과 동일하게 입력 토큰 백만 개당 5달러, 출력 백만 개당 25달러를 유지했다. 달라진 것은 Fast Mode다. Fast Mode는 입력 10달러, 출력 50달러로 책정됐는데, Anthropic에 따르면 이전 Fast Mode 대비 약 3배 저렴한 수준이다. 응답 속도가 중요하지만 비용 부담도 무시할 수 없는 워크로드 — 챗봇, 실시간 코드 보완, 검색 증강 생성(RAG) 파이프라인 등 — 에서 Opus 급 모델을 더 현실적인 선택지로 고려할 수 있게 됐다는 뜻이다.
정렬(Alignment) 측면에서도 Anthropic은 개선을 강조했다. 사용자 자율성과 최선의 이익을 보장하는 지표에서 새로운 수준을 달성했다고 밝혔으며, 기만이나 오용 협력 같은 비정렬 행동이 이전 모델 대비 현저히 줄었다고 설명했다. 기업 파트너들로부터는 더 빠르고 신뢰할 수 있는 협업 경험, 그리고 향상된 맥락 유지 능력에 대한 긍정적인 피드백이 전해졌다. 법률, 금융, 보안, 데이터 분석 분야에서 일관된 성능 개선이 보고됐다는 것도 함께 언급됐다. 모델의 능력이 올라갈수록 “왜 그렇게 답했는지”를 예측하기가 어려워지는 만큼, 이 부분의 개선은 숫자만큼이나 체감 신뢰도에서 중요하다.
그리고 Anthropic은 릴리스 공지 말미에 향후 계획을 슬며시 내비쳤다. Opus보다 상위 수준의 “Mythos”급 모델이 준비 중이라는 것이다. 아울러 더 낮은 가격대의 고성능 모델도 예고됐다. 이터레이션 속도로 볼 때 Anthropic은 프론티어 라인을 빠르게 끌어올리면서 동시에 중간 가격대 시장도 공략하는 투트랙 전략을 구체화하는 인상이다. 결국 Mythos가 어떤 형태로, 언제 등장하느냐가 OpenAI와 Google DeepMind의 상위 모델과의 격전에서 다음 장을 결정하는 변수가 될 것이다.
출처