2026년 05월 22일 AI 뉴스 — 구글 Gemini Spark, Cursor Composer 2.5, 코딩 에이전트 인프라

구글이 24시간 작동하는 AI 에이전트 Gemini Spark를 공개했다. Cursor Composer 2.5는 10분의 1 비용으로 Opus 4.7급 성능을 낸다. 안티그래비티 강제 업데이트 논란과 팀 단위 코딩 에이전트 인프라까지 오늘의 AI 뉴스 8선.

구글, 24시간 작동하는 AI 에이전트 'Gemini Spark' 공개

Google I/O 2026에서 구글이 Gemini Spark를 공개했다. 단순히 질문에 답하는 비서를 넘어, 사용자를 대신해 실제 업무를 처리하는 능동적 파트너를 표방한다. 기기가 잠겨 있어도 클라우드에서 백그라운드로 계속 작동하며, 반복 작업에 자동 트리거를 걸거나 사용자 지시로 새 스킬을 익히고 워크플로우를 통째로 만들 수 있다.

활용 예시로는 명세서에서 숨은 구독료를 찾아내거나, 학교 일정 변경을 추출하거나, 회의 노트를 정리해 초안 이메일까지 작성하는 작업이 제시됐다. Gmail, Docs, Slides 같은 워크스페이스 도구와 연동되고, Canva와 OpenTable, Instacart 등 외부 서비스와는 MCP로 연결된다.

기술적으로 Spark는 Gemini 3.5 위에서 돌아가며 구글의 Antigravity 하네스를 사용한다. 돈을 쓰거나 메일을 보내는 등 중대한 행동 전에는 반드시 사용자에게 먼저 확인을 받도록 설계됐다. 이번 주 신뢰 테스터에게 먼저 열리고, 다음 주 미국 Google AI Ultra 구독자 대상 베타로 확대된다.

원문: https://blog.google/innovation-and-ai/products/gemini-app/next-evolution-gemini-app/

Cursor Composer 2.5 — 10분의 1 비용으로 Opus 4.7급 코딩 성능

Cursor가 5월 18일 자체 코딩 모델 Composer 2.5를 출시했다. SWE-Bench Multilingual에서 79.8%, CursorBench v3.1에서 63.2%를 기록하며 Claude Opus 4.7, GPT-5.5와 주요 벤치마크에서 어깨를 나란히 한다. 그러면서도 비용은 프런티어 모델의 약 10분의 1 수준이다.

Composer 2의 후속으로, 장시간 실행되는 작업을 꾸준히 밀고 나가는 능력과 복잡한 지시를 안정적으로 따르는 능력이 개선됐다. Cursor는 강화학습 환경을 더 복잡하게 키우고 학습량을 늘렸으며, 커뮤니케이션 방식과 작업량 조절 같은 행동 측면도 다듬었다고 밝혔다.

가격은 표준 등급이 입력 100만 토큰당 0.5달러, 출력 2.5달러다. 기본값인 Fast 등급은 입력 3달러, 출력 15달러이며 출시 첫 주에는 사용량을 두 배로 제공한다. 프런티어급 성능을 저비용에 내놓는 코딩 에이전트 가격 경쟁이 본격화되는 신호다.

원문: https://cursor.com/changelog/composer-2-5

구글 안티그래비티, 강제 업데이트로 IDE를 챗봇으로 바꾸다

한 개발자가 구글 Antigravity의 2.0 업데이트를 강하게 비판하는 글을 올려 화제다. Google AI Ultra 플랜으로 매일 쓰던 Antigravity IDE가 백그라운드 자동 업데이트로 사전 경고나 동의 없이 대화형 프롬프트 입력창 하나로 바뀌어 버렸다는 것이다.

문제는 두 버전이 공존하지 못한다는 점이다. 2.0은 기본 앱 경로를 공격적으로 덮어써, 기존 IDE 버전을 재설치해도 챗봇이 매번 실행을 가로챈다. 결국 모든 것을 완전히 삭제해야만 IDE를 되살릴 수 있었고, 그 과정에서 채팅 기록과 설정이 날아갔다.

I/O 2026에서 구글은 2.0을 Codex 스타일의 독립형 경험으로 홍보했지만, plan-review-implement 루프를 지원하던 전통적 IDE가 에이전트형 챗봇으로 통째로 바뀐 것은 사실상 다른 제품이다. 글쓴이는 사용자 동의 없이 백그라운드 업데이트로 이런 전환을 강요하는 것은 매우 부적절하다고 지적했다.

원문: https://www.0xsid.com/blog/antigravity-bait-n-switch

Runtime — 엔지니어링 밖으로 코딩 에이전트를 확장하는 인프라

YC 출신 스타트업 Runtime이 팀 전체가 코딩 에이전트를 안전하게 쓰게 해주는 인프라를 들고 나왔다. Claude Code나 Cursor 같은 에이전트를 엔지니어링뿐 아니라 제품, 디자인, 마케팅, 지원, 재무 부서까지 배포하려면 가드레일과 통합, 관측, 오케스트레이션을 직접 만들어야 하는데 보통 9개월치 인프라 작업이 든다는 게 이들의 진단이다.

핵심은 샌드박스다. 에이전트는 실제 데이터를 미러링하거나 샘플링한 격리 환경에서 작동하며, PII 마스킹과 행 단위 접근 범위 같은 정책을 적용할 수 있다. 프로덕션 변경은 리뷰를 거친 PR이나 승인된 액션을 통해서만 일어나고, 에이전트가 라이브 시스템을 직접 건드리지 않는다.

Slack과 GitHub, Linear, Snowflake와 BigQuery 같은 데이터 웨어하우스, Stripe와 Salesforce, Datadog 등과의 사전 연동을 제공한다. 에이전트별, 팀별 비용 추적과 지출 한도, 파일 접근 규칙, 승인 게이트 같은 거버넌스 기능도 갖췄다. 클라우드 호스팅과 자체 호스팅을 모두 지원한다.

원문: https://www.runtm.com/

oh-my-pi — 32개 도구와 Rust 코어를 품은 터미널 코딩 에이전트

oh-my-pi(omp)는 IDE 기능을 워크플로우에 직접 통합한 터미널 기반 AI 코딩 에이전트다. Mario Zechner의 Pi 프로젝트를 포크해 실무용 기능을 더했으며, 파일 작업과 코드 인텔리전스, 실행, 조율을 아우르는 32개 내장 도구를 갖췄다.

특징적인 것은 외부 도구로 빠지지 않고 약 2만 7천 줄의 Rust를 내장해 grep, bash, AST 연산, 구문 강조 같은 성능 민감 작업을 프로세스 안에서 처리한다는 점이다. 콘텐츠 해시 기반의 hashline 앵커로 코드 편집 토큰을 약 61% 줄이고, LSP 연동으로 리팩터링과 탐색, 이름 변경을 지원하며, lldb와 dlv, debugpy 디버거에 붙어 실행 중인 프로세스를 단계별로 따라갈 수 있다.

서브에이전트가 병렬로 펼쳐져 스키마 검증된 JSON을 돌려주고, 의도별 멀티 모델 라우팅으로 역할마다 다른 제공자를 배정할 수 있다. Anthropic과 OpenAI, Gemini, xAI, Groq, 로컬 실행용 Ollama 등 40개 이상의 제공자를 지원하며, 세션 도중 model 명령으로 모델을 바꿀 수 있다.

원문: https://github.com/can1357/oh-my-pi

마이크로소프트 .NET 팀이 공개한 AI 에이전트용 스킬 모음

마이크로소프트 .NET 팀이 AI 코딩 에이전트의 .NET, C# 개발 능력을 끌어올리는 공식 스킬 모음 dotnet/skills를 공개했다. agentskills.io의 Agent Skills 표준을 따르며 11개의 전문 플러그인으로 구성된다.

플러그인은 핵심 .NET 작업, Entity Framework 데이터 접근, 성능 디버깅, 빌드 진단, 패키지 관리, 프레임워크 버전 마이그레이션, 모바일 개발, ML과 LLM 통합, 프로젝트 스캐폴딩, 테스트 실행, ASP.NET 웹 개발까지 아우른다.

Copilot CLI와 Claude Code, VS Code Insiders 프리뷰, Cursor, Codex CLI 등 여러 에이전트에서 동작한다. 정확도와 효율 점수 추이를 추적하는 성능 대시보드도 포함돼, 스킬이 실제로 도움이 되는지 측정할 수 있다. 특정 언어 생태계의 공식 팀이 에이전트용 스킬을 직접 관리하기 시작한 사례다.

원문: https://github.com/dotnet/skills

AI 엔지니어링을 수학부터 다시 쌓는 무료 커리큘럼, 435강

ai-engineering-from-scratch는 수학적 기초부터 프로덕션 배포까지 AI 개발을 처음부터 가르치는 무료 오픈소스 커리큘럼이다. 20개 단계, 435개 강의, 약 320시간 분량으로 구성된다.

학습 방식이 독특하다. 알고리즘을 먼저 수학으로 유도하고, 프레임워크 없이 직접 구현한 다음, 마지막에 프로덕션 라이브러리를 쓴다. 흩어진 튜토리얼이 아니라 모든 개념을 잇는 척추를 제공하는 것이 목표다. 0~3단계는 수학과 고전 ML, 딥러닝 핵심을, 4~6단계는 비전과 NLP, 음성을, 7~10단계는 트랜스포머와 생성 AI, 강화학습, LLM 직접 구현을 다루고, 11단계 이후는 LLM 엔지니어링과 멀티모달, 에이전트, 멀티 에이전트 협업, 인프라, 안전까지 이어진다.

각 강의는 프롬프트와 에이전트용 스킬, 에이전트, MCP 서버 같은 재사용 가능한 산출물을 함께 제공한다. 과정을 마치면 435개의 실제 도구가 워크플로우에 쌓인다. Python과 TypeScript, Rust, Julia를 다룬다.

원문: https://github.com/rohitg00/ai-engineering-from-scratch

2021년 맥북으로 1년치 영상을 로컬에서 색인하기

한 개발자가 비싼 SaaS 영상 편집 도구 대신 로컬 LLM으로 라벨 없는 영상 아카이브를 영어로 검색 가능하게 만든 과정을 공유했다. 진짜 병목은 편집이 아니라 수천 개 클립을 평문으로 검색 가능하게 만드는 색인 단계라는 통찰에서 출발한다.

파이프라인은 클립마다 프레임 5장 추출, WhisperX 음성 전사와 97개 언어 화자 구분, 얼굴 인식, 위치 역지오코딩, 비전 모델 분석을 거쳐 구조화된 메타데이터를 만든다. 결과는 각 클립 옆에 사이드카 파일로 저장돼, 아카이브가 grep 가능하고 저장 장치를 옮겨도 따라간다.

하드웨어는 64GB램의 2021년 M1 Max 맥북 프로, 모델은 LM Studio로 돌린 양자화 Gemma 4 31B다. 대량 처리 중 물리 램이 바닥나 스왑을 50.89GB까지 썼지만 주말 단위 작업에서는 SSD 손상 위험이 없다고 본다. 구조화된 프롬프트를 쓴 로컬 31B 모델이 클라우드와의 격차를 대부분 좁혔으며, enum 필드 같은 스키마 제약이 자유 텍스트 지시보다 환각을 잘 막는다는 점이 핵심 교훈이다.

원문: https://blog.simbastack.com/indexed-a-year-of-video-locally/

---

오늘의 여덟 가지 소식은 한 방향을 가리킨다. AI 에이전트가 비서에서 실무 파트너로, 코딩 도구에서 팀 단위 인프라로 넘어가고 있다는 것이다. 동시에 강제 업데이트 논란처럼 사용자 신뢰를 둘러싼 마찰도 함께 커지고 있다. 나무숲은 이런 변화를 매일 추적하며 AI를 실제 업무에 녹여내려는 팀을 돕는다. 더 깊은 적용 사례가 궁금하다면 treesoop.com에서 확인할 수 있다.