2026년 04월 12일 AI 뉴스 — Project Glasswing, Anthropic 컴퓨트, AI 벤치마크 붕괴

Anthropic Project Glasswing 출범과 Claude Mythos 사이버보안 모델, Anthropic·Google·Broadcom 기가와트급 컴퓨트 파트너십, MarkItDown 출시, AI 벤치마크 신뢰성 위기까지 2026년 4월 12일 AI 핵심 뉴스를 정리했습니다.

Project Glasswing 출범, Anthropic·Google·Broadcom 컴퓨트 파트너십, Microsoft MarkItDown, AI 에이전트 워크플로 자동화까지 오늘의 AI 뉴스.

Project Glasswing — AI로 AI 보안을 지키다

Anthropic이 AWS, Apple, Cisco 등 주요 테크 기업들과 함께 Project Glasswing을 출범했습니다. 핵심은 Claude Mythos Preview — 운영체제와 웹 브라우저 등 핵심 소프트웨어에서 수천 건의 미발견 취약점을 식별할 수 있는 프론티어 AI 모델입니다. Anthropic은 이 프로젝트에 1억 달러 규모의 사용 크레딧과 400만 달러의 기부를 약속했습니다.

핵심 메시지는 긴박성입니다. AI가 취약점 발견 능력을 갖출수록, 방어자도 같은 도구를 먼저 써야 합니다. 공격자보다 앞서 취약점을 찾고 패치하는 것이 이 이니셔티브의 목표입니다.

원본 보기

Anthropic, Google·Broadcom과 기가와트급 AI 인프라 구축

Anthropic이 Google·Broadcom과 파트너십을 맺고 2027년부터 차세대 TPU 다중 기가와트 용량을 미국 내에 배치합니다. 이번 계약은 Anthropic 역사상 최대 규모의 컴퓨트 투자이며, Claude의 역량 확장과 급증하는 고객 수요에 대응하기 위한 것입니다.

비즈니스 지표도 주목됩니다. Anthropic의 연 환산 매출(run-rate revenue)은 300억 달러를 돌파했으며, 연간 100만 달러 이상을 사용하는 엔터프라이즈 고객이 1,000개를 넘었습니다.

원본 보기

Microsoft MarkItDown — 모든 문서를 LLM 친화적 마크다운으로

Microsoft가 공개한 MarkItDown은 PDF, Office 문서, 이미지, 오디오, HTML 등 다양한 형식을 LLM 처리에 최적화된 마크다운으로 변환하는 경량 파이썬 유틸리티입니다. 제목, 목록, 표, 링크 등 문서 구조를 그대로 보존하며, Azure Document Intelligence 및 LLM 비전 API와도 통합됩니다.

RAG 파이프라인, AI 문서 분석, 에이전트 워크플로에서 비정형 문서를 다룰 때 필수 도구로 자리잡을 가능성이 높습니다.

원본 보기

Archon — AI 코딩을 결정론적으로 만드는 워크플로 엔진

Archon은 AI 보조 코딩을 예측 가능하고 반복 가능하게 만드는 오픈소스 워크플로 엔진입니다. 개발 프로세스를 YAML 워크플로로 정의하여 계획 → 구현 → 검증 → 코드 리뷰 → PR 생성의 각 단계에서 AI가 정해진 틀 안에서 동작하도록 강제합니다.

GitHub 이슈 수정, 기능 추가 등 17가지 내장 워크플로를 제공하며, CLI, 웹 UI, Slack, Telegram, Discord 등 다양한 플랫폼을 지원합니다. 각 워크플로는 독립된 git worktree에서 실행되어 충돌을 방지합니다.

원본 보기

소형 모델도 Mythos급 취약점을 찾는다 — AI 사이버보안의 울퉁불퉁한 최전선

AISLE 연구팀이 Anthropic의 Mythos 사이버보안 모델과 소형 오픈소스 모델을 비교 테스트한 결과, 많은 역량이 이미 광범위하게 접근 가능하다는 사실을 발견했습니다. 취약점 탐지 성능은 모델 크기에 비례하지 않고 "들쭉날쭉한(jagged)" 패턴을 보였으며, 모델별로 잘하는 영역이 달랐습니다.

연구팀의 핵심 주장: "AI 사이버보안의 해자(moat)는 모델이 아니라 시스템이다." 오케스트레이션, 보안 전문성, 유지보수자와의 관계가 단일 프론티어 모델보다 중요하다는 의미입니다.

원본 보기

AI 에이전트 벤치마크를 우리가 무너뜨린 방법

UC 버클리 연구팀이 SWE-bench, WebArena, OSWorld 등 8개 주요 AI 에이전트 벤치마크에서 실제 태스크를 풀지 않고도 거의 만점에 가까운 점수를 낼 수 있음을 자동화된 스캐닝으로 증명했습니다. 에이전트-평가자 간 격리 미흡, 노출된 정답 키, 취약한 검증 로직 등 시스템적 결함이 원인이었습니다.

벤치마크 점수가 모델 선택과 투자 결정의 근거가 되는 만큼, 이 연구는 현재 리더보드가 실제 역량을 반영하지 못할 수 있음을 경고합니다. 팀은 'Agent-Eval Checklist'와 벤치마크 적대적 테스트 도구 BenchJack도 공개했습니다.

원본 보기

OpenAI, Axios 공급망 공격 대응 — macOS 앱 인증서 교체

2026년 3월 31일, OpenAI의 macOS 앱 서명 파이프라인에 사용된 GitHub Actions 워크플로가 북한 연계 세력이 조작한 Axios 1.14.1을 다운로드·실행했습니다. 해당 워크플로는 ChatGPT Desktop, Codex, Atlas 등 macOS 앱의 코드 서명 인증서에 접근할 수 있었습니다.

OpenAI는 macOS 코드 서명 인증서를 폐기·교체하고 영향을 받은 앱을 재빌드했습니다. 사용자 데이터, 내부 시스템, 프로덕션 소프트웨어는 침해되지 않았다고 밝혔으며, 2026년 5월 8일 이후 구버전 앱 사용이 중단됩니다.

원본 보기

OpenAI, 엔터프라이즈 AI 다음 단계 발표

OpenAI 매출에서 엔터프라이즈 비중이 40%를 돌파했으며, 2026년 말에는 소비자 매출과 동등해질 전망입니다. Codex는 연초 대비 5배 이상 성장했고, 가장 앞서 있는 기업들은 AI를 단순 작업 보조가 아닌 에이전트 팀 관리 도구로 전환하고 있습니다.

OpenAI의 멀티모델 전략도 구체화됩니다. GPT-5(코딩·에이전트), GPT-5.2(엔터프라이즈 지식 업무), gpt-oss 오픈웨이트 패밀리(자체 호스팅·커스터마이징)로 라인업이 분화됩니다. 수익 모델도 토큰 판매에서 성과 기반 수익 분배 방식으로 전환을 예고했습니다.

원본 보기

---

오늘의 AI 뉴스는 나무숲(treesoop.com)에서 매일 큐레이션합니다. 더 많은 기술 인사이트가 궁금하다면 나무숲 블로그를 구독해 보세요.

관련 서비스가 필요하시면 나무숲(TreeSoop)의 AI 개발 서비스을 확인해보세요.

---

*글쓴이: 남대현 | TreeSoop CEO, POSTECH 컴퓨터공학 AI/MR/HCI 석사*

AI 전환 전략부터 프로덕션 배포까지 50+ 프로젝트를 리드했습니다.

AI 관련 프로젝트가 필요하시면 카카오톡으로 문의하세요.