2026년 5월 17일 AI 뉴스 — Claude 스몰비즈, Codex 모바일, NVIDIA 1만명
앤트로픽이 소상공인용 Claude 패키지를, OpenAI는 Codex를 ChatGPT 모바일로 출시했다. NVIDIA 1만명이 Codex를 업무에 쓰고, Stanford는 에이전트 AI가 71% 생산성을 끌어올린다고 발표했다.
# 2026년 5월 17일 AI 뉴스 — Claude 스몰비즈, Codex 모바일, NVIDIA 1만명
오늘 AI 업계 핵심 소식을 한 번에 정리한다. 앤트로픽이 소상공인 시장을 겨냥한 Claude 전용 패키지를 공개했고, OpenAI는 Codex를 ChatGPT 모바일 앱으로 가져왔다. NVIDIA는 1만 명 이상의 직원이 GPT-5.5 기반 Codex를 일상 업무에 쓰고 있다고 발표했다. 학계에서는 스탠퍼드가 51개 실제 AI 배포 사례를 분석해 에이전트형 AI가 71% 생산성 향상을 만든다는 결과를 내놓았다.
앤트로픽, 소상공인을 위한 Claude 출시
앤트로픽이 소상공인 전용 패키지 Claude for Small Business를 공개했다. QuickBooks, PayPal, HubSpot, Canva, DocuSign, Google Workspace, Microsoft 365 등 소상공인이 이미 쓰고 있는 도구에 Claude를 직접 연결하는 커넥터와 워크플로우 묶음이다. 재무·운영·세일즈·마케팅·HR·고객지원 6개 영역에 걸쳐 15개의 사전 구성된 에이전트 워크플로우가 포함된다. 급여 산정, 월말 결산, 미수금 청구, 캠페인 관리처럼 시간이 많이 드는 반복 작업을 자동화하는 것이 목표다.
미국 GDP의 44%를 차지하지만 AI 도입에서 가장 뒤처져 있던 소상공인 시장을 정조준한 움직임이다. 사용자 승인, 권한 보존, Team/Enterprise 플랜의 기본 데이터 학습 비활성화 등 신뢰 기반 정책으로 도입 장벽을 낮췄다. 대기업과 동등하게 경쟁할 도구를 소상공인에게 풀겠다는 메시지가 분명하다.
원문: https://www.anthropic.com/news/claude-for-small-business
OpenAI Codex, ChatGPT 모바일 앱으로 안착
OpenAI가 Codex를 iOS·Android ChatGPT 앱에 정식으로 들였다. 폰에서 Codex가 돌고 있는 모든 스레드를 열어 모니터링하고, 출력을 검토하고, 명령을 승인하고, 모델을 바꾸거나 새 작업을 시작할 수 있다. 파일·자격 증명·권한은 작업이 돌고 있는 머신에 그대로 남고, 스크린샷·터미널 출력·디프·테스트 결과·승인 요청만 폰으로 실시간 흘러온다.
핵심은 안전한 릴레이 레이어다. 신뢰된 머신을 외부 인터넷에 노출하지 않으면서 여러 기기에서 접근할 수 있도록 했고, ChatGPT 로그인 상태에서는 활성 세션과 컨텍스트가 어디서든 동기화된다. iOS·Android 전 지역 Free·Go 포함 모든 플랜에 프리뷰로 푼다. CI 파이프라인이나 자동화에서 쓸 수 있는 프로그래매틱 액세스 토큰도 함께 공개했다.
원문: https://openai.com/index/work-with-codex-from-anywhere
NVIDIA 1만 명, GPT-5.5 Codex로 업무 자동화
NVIDIA가 GPT-5.5 기반 Codex를 사내에 깔았다. 엔지니어링·제품·법무·마케팅·재무·세일즈·HR·운영·개발자 프로그램 등 1만 명 이상의 NVIDIAN이 이미 Codex를 쓰고 있다. 엔지니어들은 복잡한 엔지니어링 작업의 디폴트 도구로 Codex를 채택했고, 머신러닝 실험을 end-to-end로 돌리는 데도 활용한다. 내부 플랫폼 하나는 MVP에서 프로덕션 시스템으로 발전시키는 작업을 Codex가 주도했다.
연구 측면에서는 GPT-5.5 내부 빌드가 조합론의 오랜 난제인 오프대각 램지 수의 점근적 증명에 기여했다. 증명은 Lean으로 형식 검증을 거쳤다. NVIDIA AI 리서처 Shaunak Joshi는 "지식 노동, 특히 창의적 파트너로서 GPT-5.5는 거대한 잠금 해제(massive unlock)"라고 평가했다. 2016년 황 회장이 OpenAI 본사에 첫 DGX-1을 직접 배달한 이래 10년에 걸친 협업의 연장선이다.
원문: https://openai.com/index/nvidia
대규모 코드베이스에서 Claude Code 잘 쓰는 법 (공식 가이드)
앤트로픽이 Claude Code를 대규모 코드베이스에서 효과적으로 굴리기 위한 공식 베스트 프랙티스를 정리했다. 핵심 원칙은 단순하다 — Claude Code는 사람 엔지니어처럼 코드를 탐색한다. 파일 시스템을 돌아다니고, 파일을 읽고, grep으로 필요한 것만 찾고, 참조를 따라간다. 따라서 코드베이스가 탐색하기 좋게 정돈돼 있을수록 결과가 좋아진다.
구체적인 가이드는 다음과 같다. 루트와 서브디렉토리에 계층적으로 CLAUDE.md를 두어 컨텍스트를 분산 배치하고, 심볼 단위 정확도를 위해 LSP를 통합한다. 테스트·린트 명령은 서브디렉토리별로 범위를 잘라 타임아웃을 피한다. 루트 레벨 문서는 가볍게 유지하고, 레포 루트보다는 관련 서브디렉토리에서 Claude를 초기화하라. 생성된 파일은 `.claudeignore`로 제외한다. 마지막으로 전담 DRI나 인프라 팀이 설정을 유지보수하고 플러그인으로 조직 전체에 검증된 설정을 배포하라는 조언으로 마무리한다.
원문: https://claude.com/blog/how-claude-code-works-in-large-codebases-best-practices-and-where-to-start
obra/superpowers — 코딩 에이전트용 완성형 개발 방법론
obra/superpowers는 AI 코딩 에이전트를 위한 완성형 소프트웨어 개발 방법론이다. 단순 프롬프트 모음이 아니라 조합 가능한 스킬 위에 올려진 워크플로우 전체를 제공한다. 대화를 통한 설계 정제 → 상세 구현 계획 작성 → 서브에이전트 기반 실행 → 체계적 코드 리뷰의 4단계로 흐른다.
핵심 강조점은 TDD, git 기반 워크플로우 관리, 그리고 자율 실행이다. 에이전트가 승인된 명세와 품질 기준을 유지하면서 장시간 독립적으로 작업할 수 있도록 설계됐다. Claude Code 같은 에이전트에 그대로 얹어 쓸 수 있는 형태라, 자기만의 에이전트 하네스를 구축 중인 팀이 참고하기 좋다.
원문: https://github.com/obra/superpowers
codegraph — Claude Code용 사전 인덱싱 코드 지식 그래프
codegraph는 로컬에서 동작하는 사전 인덱싱 코드 지식 그래프다. Claude Code가 매번 grep과 read로 파일을 스캔하면서 토큰을 낭비하는 문제를 정조준한다. 심볼·관계·호출 그래프를 미리 SQLite DB에 색인해 두고, 에이전트는 즉시 쿼리만 날리면 된다.
벤치마크 결과가 인상적이다. 도구 호출 94% 감소, 탐색 속도 77% 향상, 100% 로컬. 복잡한 아키텍처 질문에 대해 기존 26~52번 호출이 필요했던 작업이 1~6번 호출로 끝난다. 데이터가 머신 밖으로 나가지 않으므로 프라이버시 측면에서도 안전하다. 대형 모노레포에서 Claude Code 비용이 부담스럽다면 한 번 검토해볼 만하다.
원문: https://github.com/colbymchenry/codegraph
Orthrus — Qwen3에서 7.8배 무손실 추론 가속
Orthrus는 자기회귀 LLM에 디퓨전 기반 병렬 토큰 생성을 결합한 추론 가속 프레임워크다. 생성 작업에서 최대 7.8배 속도 향상을 보이면서도 원본 모델 출력과 strictly lossless하게 일치한다. Qwen3 1.7B·4B·8B 모델을 지원하며 각각 4.25~5.36배의 속도 향상을 낸다.
핵심 차별점은 KV 캐시 공유 구조다. 별도 드래프트 모델과 중복 KV 캐시가 필요한 기존 speculative decoding과 달리, Orthrus는 두 아키텍처 뷰가 같은 캐시를 공유해 메모리 오버헤드를 없애고 토큰 수용률을 높였다. 체크포인트도 공개됐기 때문에 Qwen3로 서빙 중이거나 자체 추론 스택을 굴리는 팀이라면 즉시 적용해 효과를 측정할 수 있다.
원문: https://github.com/chiennv2000/orthrus
Stanford — 에이전트형 AI가 71% 생산성 향상을 만든다
스탠퍼드의 Enterprise AI Playbook 보고서가 41개 조직·9개 산업·7개 국가·100만 명 이상 직원을 아우르는 51개 성공적인 프로덕션 AI 배포 사례를 분석했다. 결과는 명확하다. 에이전트형(agentic) AI 배포가 중앙값 71%의 생산성 향상을 만든 반면, 고자동화(high-automation) 시스템은 40%에 그쳤다. 단, 에이전트형 사례는 전체의 20%에 불과하다.
차이를 만드는 진짜 요인은 기술이 아니라 워크플로우 설계, 경영진 스폰서십, 예외 처리였다. 보고서는 "에이전트형 AI는 새로운 UI가 아니라 워크플로우에서 인간과 기계의 역할 재정의"라고 정리한다. 중심 명제는 단순하다 — AI 성공은 기술 문제가 아니라 조직 변화 문제다.
원문: https://reddit.com/r/artificial/comments/1tebiq4/stanford_studied_51_real_ai_deployments_and_found/
---
오늘은 앤트로픽과 OpenAI의 제품 확장, 그리고 NVIDIA의 도입 사례가 동시에 터졌다. AI 도구가 점점 폰·소상공인·대기업 전 조직으로 침투하고 있다는 흐름이 분명하다. 스탠퍼드 연구처럼 도구만 깐다고 되는 게 아니라 워크플로우 재설계가 핵심이라는 점도 같이 짚고 가자.
나무숲은 이런 매일의 AI 흐름을 정리해 한국 개발자에게 전달한다. 매일 아침 AI 뉴스를 받아보고 싶다면 TreeSoop 블로그를 구독해 두면 된다.