2026년 7월 2일 AI 뉴스 — 클로드 소네트 5, 로컬 LLM, AI 에이전트 인프라

앤트로픽 클로드 소네트 5·클로드 사이언스·페이블 5 재출시, Qwen 3.6 로컬 구동, 브라우저 LFM2 추론, 아틀라시안 DESIGN.md, 텐센트 샌드박스, herdr까지 오늘의 AI 뉴스 8선.

2026년 7월 2일, AI 업계는 앤트로픽의 새 모델 라인업으로 뜨거웠습니다. 클로드 소네트 5 출시부터 브라우저에서 도는 로컬 추론, AI 에이전트 실행 인프라까지 오늘의 핵심 소식 8건을 정리했습니다.

앤트로픽, 클로드 소네트 5 공개

앤트로픽이 6월 30일 클로드 소네트 5를 공개했습니다. "역대 가장 에이전트적인 소네트"를 표방하며, 자율적인 계획 수립과 도구 사용 능력이 상위 모델인 오퍼스 4.8에 근접하면서도 비용은 훨씬 낮게 유지됩니다. 전작 소네트 4.6 대비 추론·코딩·도구 활용에서 큰 폭으로 개선됐습니다.

가격은 8월 31일까지 프로모션으로 입력 100만 토큰당 2달러, 출력 100만 토큰당 10달러이며, 이후 정상가는 각각 3달러·15달러입니다. 안전성 평가에서 소네트 4.6보다 유해 행동 비율이 낮아졌고, 오퍼스 대비 사이버보안 능력은 의도적으로 낮추고 실시간 안전장치를 기본 활성화했습니다. Free·Pro·Max·Team·Enterprise 전 플랜에서 바로 사용할 수 있습니다.

원문: https://www.anthropic.com/news/claude-sonnet-5

과학자를 위한 AI 워크벤치, 클로드 사이언스

앤트로픽이 연구 전 과정을 아우르는 AI 워크벤치 '클로드 사이언스'를 베타로 출시했습니다. 문헌 분석부터 논문 작성까지, PubMed·Jupyter·데이터베이스처럼 흩어져 있던 도구를 하나의 환경으로 통합해 재현 가능한 방식으로 연구를 진행할 수 있습니다.

3D 단백질 구조와 분자 시각화를 네이티브로 렌더링하고, 로컬 머신이나 고성능 클러스터에 걸쳐 컴퓨트를 자동 관리합니다. 유전체학·단백질체학 등을 위한 60종 이상의 전문 과학 스킬과 데이터베이스에 사전 연결돼 있습니다. Pro·Max·Team·Enterprise 구독자가 대상이며, 재현성과 데이터 프라이버시를 지키면서 발견을 가속하려는 연구자를 겨냥합니다.

원문: https://www.anthropic.com/news/claude-science-ai-workbench

앤트로픽, 페이블 5 전세계 재출시

6월 30일 미국 수출 규제가 해제되면서 클로드 페이블 5가 7월 1일부로 전 세계에 다시 배포됐습니다. 이번 재배포에는 이전 보고서에서 지적된 탈옥(jailbreak) 행위를 겨냥해 차단하는 개선된 안전 분류기가 함께 적용됐습니다.

앤트로픽은 아마존·마이크로소프트·구글 등과 협력해 탈옥을 능력 획득, 확산 범위, 무기화 용이성, 발견 가능성 네 가지 기준으로 점수화하는 업계 공통 프레임워크를 마련했습니다. 앞으로의 위협에 일관되게 대응하기 위한 장치입니다. 7월 7일까지 포용적 접근이 제공되며, 강화된 안전장치가 일부 정상적인 코딩 요청까지 막을 수 있다는 점은 보안을 위한 의도된 트레이드오프입니다.

원문: https://www.anthropic.com/news/redeploying-fable-5

Qwen 3.6 27B, 맥에서 로컬로 돌린다

Qwen 3.6 27B가 2025년 중반 프론티어 모델에 견줄 만한 성능을 로컬에서 낸다는 실전 후기가 나왔습니다. 맥북 맥스 M5에서 8비트 양자화로 초당 약 30토큰, 약 42GB RAM으로 구동돼 소비자용 하드웨어에서 충분히 실용적입니다.

코딩·창작·일반 개발 작업 모두에서 강점을 보이며, 필자는 더 빠른 35B 변형보다 느리더라도 품질이 높은 이 모델을 선호한다고 밝혔습니다. llama.cpp로 로컬 구동하면 프라이버시·커스터마이즈·비용 측면의 이점을 누리면서 AI 보조 개발을 실전에 적용할 수 있습니다.

원문: https://quesma.com/blog/qwen-36-is-awesome/

브라우저에서 도는 LFM2 추론

WebGPU 커널을 이용해 LFM2 모델 추론을 웹 브라우저 안에서 직접 실행하는 Hugging Face 스페이스가 공개됐습니다. GPU 가속 연산 커널을 활용해 서버 측 처리 없이 브라우저에서 추론을 수행합니다.

설치도 서버도 필요 없이 최신 브라우저만 있으면 클라이언트 측에서 AI를 구동할 수 있어, 브라우저 기반 머신러닝 배포의 문턱을 한층 낮추는 사례로 평가됩니다.

원문: https://huggingface.co/spaces/webml-community/lfm2-webgpu-kernels

아틀라시안, AI 코딩용 DESIGN.md 공개

DESIGN.md는 기계가 읽는 디자인 토큰과 사람이 읽는 디자인 가이드를 결합해, AI가 더 브랜드에 맞는 인터페이스를 생성하도록 돕는 오픈소스 마크다운 포맷입니다. 아틀라시안은 이 이식 가능한 포맷을 자사의 MCP 서버·스킬과 비교 테스트했습니다.

그 결과 DESIGN.md는 토큰을 약 92% 더 소비하고 결과 생성도 더 오래 걸렸습니다. 필요할 때 맥락을 불러오는 대신 "매번 전부"를 로드하기 때문입니다. 프로토타이핑과 크로스플랫폼 이식성에는 유용하지만, 기존 컴포넌트 라이브러리와 코딩 표준을 유지해야 하는 프로덕션 환경에서는 더 풍부한 툴링이 낫다는 결론입니다.

원문: https://www.atlassian.com/blog/ai-at-work/atlassians-design-md-is-here-what-we-learned-testing-portable-design-context-in-practice

텐센트, AI 에이전트용 보안 샌드박스 CubeSandbox

텐센트 클라우드가 AI 에이전트 코드를 안전하게 실행하는 고성능 샌드박스 'CubeSandbox'를 공개했습니다. 공유 컨테이너 커널이 아니라 전용 게스트 OS 커널을 통해 하드웨어 수준의 격리를 제공하는 것이 특징입니다.

60ms 미만의 시작 시간, 인스턴스당 약 5MB의 낮은 메모리 오버헤드, E2B SDK 호환성, 자격증명 볼트·이그레스 필터링 같은 보안 제어를 갖췄습니다. RustVMM과 KVM 기반의 가상화 아키텍처로 노드당 수천 개의 동시 샌드박스를 전통적 VM 수준의 보안으로 운영할 수 있습니다.

원문: https://github.com/TencentCloud/CubeSandbox

터미널에서 여러 AI 에이전트를 동시에, herdr

herdr는 "모든 코딩 에이전트를 한 터미널에서" 돌리는 터미널 기반 에이전트 멀티플렉서입니다. 각 AI 코딩 에이전트에 실제 터미널 창을 하나씩 부여하고, 사이드바에서 각 에이전트의 상태(대기·작업 중·완료·유휴)를 한눈에 보여줍니다.

에이전트를 백그라운드 서버에 유지하므로, 어떤 터미널에서든 심지어 SSH로 접속한 휴대폰에서도 실행 세션을 잃지 않고 분리·재연결할 수 있습니다.

원문: https://github.com/ogulcancelik/herdr

---

매일 아침 AI 뉴스를 큐레이션해 전해드리는 나무숲입니다. 오늘도 AI를 업무에 활용하는 데 도움이 되셨길 바랍니다. 더 많은 소식은 treesoop.com에서 확인하세요.