반응형
Anthropic’s new Claude 4.1 dominates coding tests days before GPT-5 arrives
Anthropic's Claude Opus 4.1 achieves 74.5% on coding benchmarks, leading the AI market, but faces risk as nearly half its $3.1B API revenue depends on just two customers.
venturebeat.com
Anthropic이 새로운 AI 모델 Claude Opus 4.1을 출시하며 코딩 분야에서 상당한 성능을 보여주고 있습니다.
이 모델은 실제 소프트웨어 엔지니어링 문제 해결 능력을 평가하는 SWE-bench Verified 테스트에서 74.5%의 점수를 기록했습니다.
이는 OpenAI의 o3 모델(69.1%)과 구글의 Gemini 2.5 Pro(67.2%)를 크게 앞서는 결과입니다.
반응형
'AI' 카테고리의 다른 글
| Anthropic, Claude Code 자동화 보안 리뷰 출시 (0) | 2025.08.09 |
|---|---|
| 오픈AI 이어 구글도 AI 가정 교사 '가이드 학습' 출시 (0) | 2025.08.09 |
| 구글 딥마인드, 물리 법칙 스스로 학습하는 세계 모델 Genie 3 공개 (2) | 2025.08.09 |
| 오픈AI도 '오픈 웨이트' AI 모델 공개 (1) | 2025.08.09 |
| xAI, 성인용 콘텐츠 이미지와 비디오 생성 가능한 Grok Imagine 출시 (0) | 2025.08.09 |
댓글