블로그로 돌아가기
Tech Insight2026년 5월 21일170

2026년 05월 21일 AI 뉴스 — 로컬 LLM 가드레일, 에이전트 도구, KPMG의 Claude 도입

8B 모델을 99%로 끌어올리는 Forge, 내 하드웨어 맞춤 LLM 추천 whichllm, 에이전트용 가상 파일시스템 Mirage, ViMax 영상 생성, Codex Goals, KPMG의 전사 Claude 통합까지 오늘의 AI 뉴스 8선.

오늘의 AI 뉴스는 "프런티어 모델 없이도 잘 돌아가게 만드는" 흐름이 두드러진다. 작은 로컬 모델을 실전 수준으로 끌어올리는 가드레일 프레임워크, 내 하드웨어에 맞는 LLM을 골라주는 도구, 에이전트가 모든 백엔드를 파일처럼 다루게 하는 가상 파일시스템까지 — 개발자가 당장 손에 쥘 수 있는 도구가 많다. 여기에 영상·음성·3D 생성 모델과 KPMG의 전사 Claude 도입 소식을 더했다.

8B 로컬 모델을 53%에서 99%로 끌어올리는 가드레일, Forge

Forge는 작은 자체 호스팅 모델(8B급)로도 안정적인 멀티스텝 에이전트 워크플로우를 돌릴 수 있게 해주는 파이썬 프레임워크다. 핵심은 세 가지 가드레일 메커니즘이다. 잘못 생성된 도구 호출을 교정하는 rescue parsing, 올바른 도구 사용으로 유도하는 retry nudge, 그리고 필수 단계를 반드시 거치게 하는 step enforcement다.

이 신뢰성 레이어 덕분에 8B 로컬 모델이 Forge의 26개 시나리오 평가에서 86.5%를 기록했다. 프런티어급 모델 없이도 체계적인 오류 복구와 컨텍스트 관리만으로 에이전트 성능을 크게 끌어올릴 수 있다는 점을 보여준다. 구조화된 워크플로우 러너, 기존 오케스트레이션 루프에 끼우는 미들웨어, OpenAI 호환 프록시 서버 등 여러 형태로 쓸 수 있다.

https://github.com/antoinezambelli/forge

내 하드웨어에 가장 잘 맞는 로컬 LLM을 찾아주는 whichllm

whichllm은 GPU·CPU·RAM을 자동 감지한 뒤, 내 환경에서 실제로 돌아가고 최고 성능을 내는 로컬 LLM을 골라주는 CLI 도구다. 단순히 VRAM에 들어가는 가장 큰 모델을 추천하는 게 아니라, LiveBench와 Chatbot Arena 같은 최신 벤치마크를 반영해 모델을 순위화한다는 점이 차별점이다.

GGUF, AWQ, GPTQ, 풀 프리시전 포맷을 지원하며, 추천 모델을 바로 실행하는 원커맨드 채팅 기능과 코드 스니펫도 제공한다. 다양한 하드웨어 시나리오를 테스트하거나 GPU 업그레이드를 계획할 때도 유용하다. 파라미터 수가 아니라 실측 성능 기준으로 고른다는 발상이 핵심이다.

https://github.com/Andyyyy64/whichllm

모든 백엔드를 파일처럼 다루는 에이전트용 가상 파일시스템, Mirage

Mirage는 AI 에이전트가 여러 서비스와 데이터 소스를 하나의 익숙한 파일시스템 인터페이스로 다루게 해주는 통합 가상 파일시스템이다. 에이전트는 백엔드마다 다른 API를 익힐 필요 없이, S3·Google Drive·Slack·Redis 같은 리소스를 마치 로컬 디렉터리처럼 표준 유닉스 bash 명령으로 다룰 수 있다.

이 접근이 강력한 이유는 현대 LLM이 이미 bash 어휘에 충분히 학습돼 있기 때문이다. 덕분에 에이전트는 한 번의 상호작용으로 더 많은 일을 처리하고, 데이터 파이프라인도 서비스 간에 자연스럽게 조합된다. Python·TypeScript SDK와 CLI로 제공되며 OpenAI Agents SDK, LangChain 등 주요 에이전트 프레임워크와 바로 연동된다.

https://github.com/strukto-ai/mirage

기획부터 완성까지, 올인원 AI 영상 제작 프레임워크 ViMax

ViMax는 콘셉트에서 최종 영상까지 제작 전 과정을 자동화하는 AI 영상 생성 프레임워크다. 감독·각본가·프로듀서·영상 생성기를 하나로 묶어, 전통적인 제작 병목을 없애는 것을 목표로 한다. 거친 아이디어를 완성된 스토리로 바꾸는 Idea2Video, 각본을 영상으로 옮기는 Script2Video, 사용자를 등장인물로 삽입하는 AutoCameo 같은 기능을 갖췄다.

가장 주목할 점은 다수의 프레임에 걸쳐 캐릭터와 장면 일관성을 유지하면서 멀티숏 장편 영상을 만들어낸다는 것이다. 짧고 일관성 없는 클립만 만들어내던 기존 AI 영상 도구의 한계를 정면으로 겨냥한다.

https://github.com/HKUDS/ViMax

Codex에 "목표"를 부여하는 법 — OpenAI의 Goals 가이드

OpenAI가 Codex의 Goals 기능 사용법을 쿡북으로 정리했다. Goals는 매번 프롬프트를 반복하지 않고도 Codex가 여러 턴에 걸쳐 정의된 목표를 향해 일하게 하는 지속적 목표 설정 기능이다. 문서의 표현을 빌리면, Goal은 "무엇이 참이어야 하는지, 성공을 어떻게 확인하는지, 어떤 제약을 지켜야 하는지"라는 완료 조건을 Codex에 부여한다.

성능 최적화, 버그 추적, 연구 재현처럼 다음 단계가 중간 발견에 따라 달라지는 복잡한 작업에 적합하다. 일반 요청이 "요청-작업-결과-대기" 패턴이라면, Goals는 "작업-검증-계속"이라는 사이클로 동작한다. /goal pause, /goal resume, /goal clear 같은 명령으로 사용자가 통제권을 유지하므로, 무한 루프가 아니라 경계가 있는 자율성을 제공한다.

https://developers.openai.com/cookbook/examples/codex/using_goals_in_codex

실시간 음성 합성 모델, Supertone의 Supertonic-3

Supertonic-3는 음성·오디오 AI에 특화된 기업 Supertone이 공개한 텍스트 투 스피치(TTS) 모델이다. 텍스트 입력을 고품질 음성으로 변환하며, Hugging Face Space에서 직접 데모를 돌려볼 수 있다.

공개 직후 상당한 좋아요를 받으며 음성 생성 분야에서 빠르게 주목받고 있다. 별도 설치 없이 브라우저에서 음성 합성 품질을 바로 확인할 수 있어, TTS를 자기 제품에 붙이려는 개발자가 후보 모델을 비교할 때 좋은 출발점이 된다.

https://huggingface.co/spaces/Supertone/supertonic-3

텐센트 ARC의 3D 생성 모델 Pixal3D

Pixal3D는 텐센트 ARC 연구팀이 Hugging Face Space로 공개한 AI 3D 생성 도구다. 이름과 맥락이 가리키듯 이미지나 입력으로부터 3D 에셋을 만들어내는 생성 모델로, Zero GPU 인프라 위에서 무료로 돌아간다.

공개 이후 200에 가까운 좋아요를 받으며 관심을 모으고 있다. 게임·메타버스·제품 시각화처럼 3D 자산이 필요한 작업에서, 별도 설치 없이 브라우저에서 바로 생성 품질을 가늠해볼 수 있다는 점이 매력이다.

https://huggingface.co/spaces/TencentARC/Pixal3D

KPMG, 27만 6천 명 전사에 Claude 통합

138개국에서 활동하는 글로벌 회계·컨설팅 기업 KPMG가 Anthropic과 손잡고 27만 6천여 명 임직원의 업무 플랫폼에 Claude를 통합한다고 발표했다. Claude는 KPMG의 핵심 업무 플랫폼인 Digital Gateway에 내장되며, 세무·법무 도구를 시작으로 사이버보안 취약점 탐지 영역까지 확장된다.

또한 KPMG는 사모펀드 포트폴리오 기업에 Claude를 배포하는 Anthropic의 우선 컨설팅 파트너가 되어, KPMG Blaze 같은 신규 서비스를 선보인다. KPMG 미국 세무 부문 부회장 Rema Serafi는 "Cowork와 Managed Agents가 Digital Gateway에 통합되면서, 예전엔 여러 도구로 몇 주씩 걸리던 작업이 이제 몇 분 만에 끝난다"고 밝혔다. 거대 컨설팅 기업의 전사적 도입은 엔터프라이즈 AI 채택이 시범 단계를 지나 본격화되고 있음을 보여주는 신호다.

https://www.anthropic.com/news/anthropic-kpmg

오늘 소식은 "큰 모델 한 방"보다 "작은 모델을 잘 다루는 도구"와 "현장 도입"으로 무게중심이 옮겨가는 흐름을 보여준다. 나무숲은 이런 AI 도구와 자동화를 실제 업무에 녹여내는 일을 돕는다. 매일 아침 핵심만 추린 AI 뉴스를 받아보고 싶다면 treesoop.com 블로그를 확인해보자.

관련 서비스: 기술 의사결정, 같이 짚어드립니다