블로그로 돌아가기
Tech Insight2026년 4월 17일143

2026년 4월 17일 AI 뉴스 — Claude Opus 4.7, Qwen3.6, OpenAI Agents SDK

Claude Opus 4.7 출시, Qwen3.6-35B-A3B 오픈소스, OpenAI Agents SDK 샌드박스 지원, Firebase 키 노출로 €54K 청구 사건 등 오늘의 AI 개발자 필독 8선.

오늘 AI 개발자 커뮤니티에서 가장 많이 회자된 8개 소식을 정리했다. Claude Opus 4.7 출시, Qwen3.6-35B-A3B 오픈소스 공개, OpenAI Agents SDK 대규모 업데이트, 그리고 Firebase 키 노출로 인한 €54,000 청구 사건까지 — 매일 AI를 쓰는 개발자가 반드시 알아야 할 이슈만 엄선했다.

1. Claude Opus 4.7 출시 — 엔지니어링·금융·법률 전반 강화

Anthropic이 Claude Opus 4.7을 공개했다. 4.6 대비 소프트웨어 엔지니어링에서 눈에 띄는 개선을 이뤘고, 복잡한 코딩 작업에서 자율성과 장시간 작업 일관성이 올라갔다. 고해상도 이미지 지원은 최대 3.75 메가픽셀까지 확장됐고, 금융·법률 같은 전문 도메인 성능도 강화됐다.

가격은 그대로 유지된다. 500만 입력 토큰당 $5, 출력 토큰당 $25. 새로운 `xhigh` 노력 수준이 추가되어 추론 품질과 지연 시간 사이에서 선택할 수 있다. 다만 토크나이저 업데이트 때문에 동일 텍스트의 입력 토큰 사용량이 1.0~1.35배 증가할 수 있다는 점은 미리 확인해두는 게 좋다.

원본 보기

2. Qwen3.6-35B-A3B — 오픈소스 에이전틱 코딩 모델의 새 기준

알리바바가 Qwen3.6-35B-A3B를 공개했다. 총 파라미터 35B, 활성 파라미터 3B의 Sparse MoE 구조로, 액티브 사이즈의 10배에 달하는 덴스 모델과 에이전틱 코딩에서 경쟁하거나 앞선다. Terminal-Bench 2.0에서 51.5점을 기록해 Gemma4-31B의 42.9점을 크게 앞질렀다.

컨텍스트는 기본 262K 토큰, 최대 1,010K까지 확장된다. 프론트엔드 워크플로우와 레포지토리 레벨 추론이 강점이라 Claude Code·Codex 같은 에이전틱 하네스에서 로컬 대안으로 바로 투입할 만하다. Hugging Face에서 FP8 양자화 버전도 함께 공개됐다.

원본 보기

3. OpenAI Agents SDK — 샌드박스·서브에이전트·100+ LLM 지원

OpenAI가 Agents SDK의 차기 업데이트를 발표했다. 핵심은 네이티브 샌드박스 실행 환경, 장기 작업용 하네스, 서브에이전트 오케스트레이션이다. 에이전트가 격리된 워크스페이스에서 파일과 코드에만 접근하면서 시스템 무결성을 유지한다.

Codex 스타일 파일 시스템 도구, MCP 기반 도구 호출, AGENTS.md 커스텀 인스트럭션, apply patch 파일 편집, shell 실행이 표준 프리미티브로 통합됐다. Python과 TypeScript 모두 서브에이전트를 지원하며, 벤더 중립적으로 100개 이상의 LLM을 오케스트레이션할 수 있다. 엔터프라이즈 에이전트를 만들 때 벤더 락인을 피하려는 팀에 가장 큰 변화다.

원본 보기

4. Claude Code v2.1.100, 요청마다 20K 숨겨진 토큰 주입 의혹

r/ClaudeCode에서 Claude Code v2.1.100이 요청당 약 20K의 보이지 않는 토큰을 주입한다는 주장이 올라왔다. 사용자는 자체 프록시 로그로 이를 증명했다고 밝혔다. 요청에 직접 쓰지 않은 시스템 컨텍스트가 삽입되면서 토큰 사용량이 예상을 크게 초과한다는 내용이다.

Pro·Max 플랜에서 레이트 리밋에 빠르게 도달하는 최근 불만과 맞물려 주목받고 있다. 버전을 롤백하거나 프록시를 걸어 요청을 직접 감사하는 것이 당장 쓸 수 있는 회피책이다. Anthropic의 공식 대응은 아직 나오지 않았다.

원본 보기

5. Claude Code 6개월 매일 사용기 — 시니어 개발자의 실전 워크플로우

r/ClaudeAI의 시니어 풀스택 개발자 정리글이 커뮤니티에서 회자되고 있다. 핵심은 여섯 가지. 복잡한 작업은 반드시 plan 모드로 먼저 설계를 받고, 기능 전체가 아니라 "첫 단계만" 요청해 리뷰 후 다음으로 넘어간다. preview를 건너뛰지 말고 항상 확인한다.

버그는 직접 수정하지 말고 Claude가 스스로 고치게 둔다. 그래야 Claude가 코드베이스의 맥락을 배운다. 리뷰 전에 `/simplify`를 돌려 과잉 엔지니어링을 정리한다. 마지막으로 세션이 끝날 때 "이번 세션에서 뭘 배웠는가"를 물어 출력물을 따로 저장하는 회고 루틴은 팀 지식 축적에 효과적이다.

원본 보기

6. Darkbloom — 유휴 Mac으로 돌리는 분산 AI 추론

Darkbloom은 전 세계 1억 대 이상 Apple Silicon 유휴 시간을 활용한 분산 AI 추론 네트워크다. 요청은 기기를 떠나기 전 암호화되며, 운영자조차 원본 데이터를 볼 수 없다. 하이퍼스케일러와 API 제공자 계층을 제거해 최대 70% 저렴한 가격을 제시한다.

OpenAI 호환 인터페이스를 제공해 기존 앱을 거의 수정 없이 붙일 수 있다. 하드웨어 소유자는 매출의 95%를 가져간다. 민감한 데이터를 다루는 기업 워크로드나 프라이버시가 중요한 개인 프로젝트에서 기존 SaaS 추론의 대안으로 테스트해볼 만하다.

원본 보기

7. €54,000 Gemini 청구 사건 — 노출된 Firebase 키의 교훈

Google AI 포럼에 올라온 한 개발자의 사건. 제한이 걸려 있지 않은 Firebase 브라우저 API 키가 공개되어 있었고, 공격자가 이를 통해 13시간 동안 Gemini API를 호출해 €54,000이 청구됐다. 트래픽은 실제 사용자와 전혀 상관 없었다.

Google 지원팀은 "프로젝트에서 정상적으로 발생한 호출"로 분류해 비용 조정을 거부했다. 교훈은 명확하다. API 키를 클라이언트에 두지 말고, 가능한 한 서버 측 호출로 이동하고, 지출 한도와 프로젝트별 상한선을 반드시 설정한다. 같은 실수가 이번 주에도 여러 팀에서 반복되고 있다.

원본 보기

8. vercel-labs/open-agents — 백그라운드 코딩 에이전트 레퍼런스

Vercel이 백그라운드 코딩 에이전트를 만들고 운영하기 위한 오픈소스 레퍼런스 앱 open-agents를 공개했다. 구조는 "웹 → 에이전트 워크플로우 → 샌드박스 VM"의 3계층이다. 에이전트는 샌드박스 외부에서 실행되면서 파일 편집과 셸 명령을 도구로 호출한다.

이 분리 덕분에 에이전트 실행이 단일 HTTP 요청 생명주기에 묶이지 않고, 샌드박스가 휴면에서 독립적으로 복구되며, 모델 교체와 구현 발전이 디커플된다. 채팅 기반 코딩 에이전트를 지속성 있게 다단계로 돌리고 싶다면 참고 구현으로 훌륭하다. PostgreSQL, Vercel OAuth, GitHub App만 설정하면 바로 배포 가능하다.

원본 보기

---

나무숲(TreeSoop)은 매일 아침 AI 개발자에게 필요한 뉴스만 골라 전달합니다. 내일도 찾아오겠습니다.