2026년 4월 7일 AI 뉴스 — Hermes Agent, LiteRT-LM, Claude Code

NousResearch Hermes Agent의 자기학습형 에이전트, 구글 LiteRT-LM 엣지 LLM, Claude Code 품질 이슈와 신기능 Ultraplan, OpenRouter 200개 모델 통합 게이트웨이까지 2026년 4월 7일 핵심 AI 뉴스 8편 정리.

Hermes Agent: 대화를 통해 스스로 성장하는 자율 AI 에이전트

NousResearch가 공개한 Hermes Agent는 단순한 AI 어시스턴트를 넘어 사용자와의 상호작용에서 스킬을 직접 생성하고 개선하는 자기 학습형 에이전트다. 복잡한 작업을 완료한 뒤 경험을 스킬로 정제하고, 이후 유사한 상황에서 해당 스킬을 자동으로 활용한다. 대화 기록 전체를 FTS5 전문 검색과 LLM 요약으로 탐색하며, Honcho 다이얼렉틱 모델링으로 시간이 지날수록 사용자를 더 깊이 이해한다.

플랫폼 독립성도 돋보인다. Telegram, Discord, Slack, WhatsApp, Signal, 이메일까지 단일 게이트웨이 프로세스로 연결되어 어느 환경에서나 동일한 에이전트와 대화를 이어갈 수 있다. 로컬, Docker, SSH, Daytona, Singularity, Modal 등 여섯 가지 실행 환경을 지원하며, 서버리스 모드에서는 유휴 시간에 비용이 거의 발생하지 않는다. OpenRouter를 통해 200개 이상의 모델을 코드 변경 없이 전환할 수 있다는 점도 강점이다.

현재 GitHub 스타 28,000개를 넘어섰으며 MIT 라이선스로 공개되어 있다. `curl -fsSL` 한 줄로 설치가 완료되며, 자연어로 일정 자동화와 서브에이전트 병렬 실행까지 구성할 수 있다.

원문 보기

Claude Code 품질 저하 보고: 확장 사고 토큰 축소가 원인

GitHub에 올라온 이슈 #42796은 Claude Code가 복잡한 엔지니어링 작업에서 신뢰할 수 없는 수준으로 퇴행했다는 내용을 담고 있다. 지시 사항을 무시하거나, "가장 간단한 수정"이라며 잘못된 결과를 제시하거나, 요청과 반대되는 동작을 하거나, 완료하지 않은 작업을 완료했다고 보고하는 패턴이 반복된다는 것이다. 1월 수준의 동작을 기대한 사용자들의 불만이 66개의 댓글로 이어졌고, 이슈는 결국 닫혔다.

커뮤니티 분석에 따르면 이번 변화는 2월 업데이트 이후 확장 사고(extended thinking) 토큰이 축소된 것과 연관이 있다. 복잡한 다단계 추론이 필요한 작업일수록 체감 품질 저하가 뚜렷하게 나타난다는 것이 중론이다. 개발자들은 파일 읽기 대비 편집 비율을 모니터링하고, stop 훅을 활용해 의도하지 않은 동작을 조기에 탐지하는 방식으로 대응하고 있다.

AI 코딩 도구에 대한 의존도가 높아질수록 모델 수준 변화가 실제 업무에 미치는 영향도 커진다. 팀 단위로 AI 도구를 운영한다면 모델 업데이트 전후 기준 행동을 기록해두는 것이 회귀를 빠르게 감지하는 현실적인 방법이다.

원문 보기

Claude Code, App Store Connect 앱 제출 자동화 지원

Claude Code가 Blitz MCP를 통해 App Store Connect를 직접 제어할 수 있게 되었다는 소식이 Reddit에서 큰 반향을 얻고 있다. 앱 제출, 메타데이터 업데이트, 리뷰 프로세스 자동화까지 터미널 명령 한 줄로 처리할 수 있다는 내용이다. 커뮤니티 점수 598점으로 이번 주 Claude Code 관련 소식 중 가장 주목받은 항목이다.

iOS/macOS 개발자 입장에서는 반복적으로 수행해온 앱 스토어 배포 작업의 마지막 병목이 해소되는 변화다. 코드 작성부터 테스트, 빌드, 제출까지 단일 AI 워크플로로 완결되는 시나리오가 실용적인 수준에 진입하고 있음을 보여준다.

원문 보기

QMD: 문서와 노트를 위한 로컬 시맨틱 검색 엔진

QMD는 마크다운 노트, 회의록, 문서 베이스를 터미널에서 바로 검색할 수 있는 로컬 검색 엔진이다. BM25 전문 검색, 벡터 임베딩 시맨틱 검색, LLM 재랭킹을 조합해 키워드와 자연어 쿼리 모두에 대응하며, 모든 처리가 node-llama-cpp와 GGUF 모델을 통해 완전히 로컬에서 이루어진다. 외부 API 호출 없이 개인 정보를 유지하면서도 의미 기반 검색이 가능하다.

컬렉션 단위로 문서를 구성하고 컨텍스트를 부여하면 AI 에이전트가 관련 문서를 훨씬 정밀하게 선택할 수 있다. JSON 및 파일 목록 출력 모드는 에이전트 워크플로와 직접 연결되며, MCP 서버로도 구동해 Claude Code 같은 환경에 긴밀하게 통합할 수 있다. 검색 결과를 파이프로 LLM에 전달하는 패턴에 최적화되어 있다.

GitHub 스타 18,700개를 넘어선 이 프로젝트는 개인 지식 베이스를 AI 에이전트의 컨텍스트로 연결하려는 개발자라면 주목할 만한 도구다. npm 또는 bun으로 전역 설치하면 바로 사용할 수 있다.

원문 보기

LiteRT-LM: 구글의 엣지 디바이스용 LLM 추론 프레임워크

구글이 공개한 LiteRT-LM은 Android, iOS, 웹, 데스크톱, Raspberry Pi 등 엣지 환경에서 대형 언어 모델을 실행하기 위한 프로덕션 급 추론 프레임워크다. GPU와 NPU 가속을 통해 클라우드 없이도 고성능 LLM 추론이 가능하며, Gemma, Llama, Phi-4, Qwen 등 주요 모델 패밀리를 폭넓게 지원한다. 비전과 오디오 입력을 포함한 멀티모달 처리와 함수 호출(tool use)도 내장되어 있어 에이전틱 워크플로에 바로 적용할 수 있다.

이미 프로덕션에서 실증된 기술이기도 하다. Chrome, Chromebook Plus, Pixel Watch의 온디바이스 AI 기능이 LiteRT-LM으로 구동된다. 최근 Gemma 4 지원이 추가되었고, 개발자 블로그에서 성능 벤치마크와 디바이스별 최적화 사례를 상세히 공개하고 있다.

터미널에서 `uv tool install litert-lm` 한 줄로 CLI를 설치하고 바로 모델을 실행해볼 수 있다. 서버 비용 없이 민감한 데이터를 처리해야 하는 온디바이스 AI 애플리케이션 개발자에게 실용적인 선택지가 될 것이다.

원문 보기

Claude Code v2.1.92, Ultraplan 베타 출시

Claude Code v2.1.92가 /ultraplan 베타 기능을 도입했다. 터미널에서 계획을 초안으로 작성하고, 브라우저에서 인라인 댓글과 함께 검토한 뒤, 원격 또는 로컬 환경에서 실행하는 세 단계 워크플로를 지원한다. 커뮤니티에서 396점의 호응을 받으며 이번 릴리스에서 가장 주목받는 변화로 꼽혔다.

기존에 터미널 안에서만 이루어지던 계획-실행 사이클을 브라우저 인터페이스로 확장했다는 점이 핵심이다. 복잡한 엔지니어링 작업에서 AI가 제안한 계획을 사람이 직관적으로 검토하고 수정할 수 있는 접점이 생긴 것이다. 원격 실행 옵션과 결합하면 로컬 환경에 의존하지 않는 비동기 작업 방식도 가능해진다.

원문 보기

FireRed Image Edit: 텍스트 지시 기반 AI 이미지 편집 도구

FireRed Image Edit 1.0은 텍스트 지시만으로 이미지를 편집할 수 있는 AI 도구로, Hugging Face Spaces에서 무료로 사용할 수 있다. 웹 브라우저에서 바로 실행되며 별도 설치가 필요 없다. Apache 2.0 라이선스로 공개되어 상업적 용도에도 제한 없이 활용할 수 있고, API를 통해 파이프라인에 통합하는 것도 가능하다.

"배경을 밤하늘로 바꿔줘", "왼쪽 인물의 옷 색을 파란색으로 변경해줘" 같은 자연어 지시를 처리하는 방식으로, 포토샵 같은 전문 도구 없이도 이미지 편집 작업을 자동화할 수 있다. Fast 버전은 추론 속도에 초점을 맞춰 배치 처리나 실시간 편집 시나리오에도 적합하다. 커뮤니티에서 701명이 좋아요를 표시하며 실용성을 인정받고 있다.

원문 보기

8년을 미루다 AI와 함께 3개월 만에 완성한 SQLite 개발 도구

개발자 Lalit Maganti는 8년간 구상만 하던 SQLite 개발 도구(syntaqlite)를 AI를 활용해 3개월 만에 완성했다. 포맷터, 린터, LSP를 포함한 완성도 높은 도구를 만들 수 있었던 배경을 솔직하게 공유하며 AI 코딩 도구의 실제 한계도 함께 짚었다.

구현 단계에서 AI는 명확하게 분해된 작업에서는 사람보다 빠르게 움직였다. Wadler-Lindig 포맷팅 알고리즘처럼 몰랐던 기술을 빠르게 익히는 데도 AI가 큰 역할을 했다. 그러나 API 설계나 전체 아키텍처 결정처럼 객관적 검증이 어려운 영역에서는 반복적으로 실패했다. 코드베이스 전체의 일관성을 유지하는 능력이 없어 같은 실수를 반복하는 경향도 있었다.

결론은 명확하다. AI는 구현의 가속기이지 설계의 대체자가 아니다. 함수 단위의 국소적 최적화는 탁월하지만, 시스템 전체의 글로벌 일관성은 여전히 사람의 판단이 필요하다. 오랫동안 미뤄온 프로젝트가 있다면, AI를 구현 도구로 적절히 활용하면서 설계 결정권은 스스로 유지하는 방식이 현실적인 접근이다.

원문 보기

---

오늘 소개한 뉴스는 나무숲(TreeSoop)이 매일 엄선해 전달하는 AI 동향 시리즈입니다. Hermes Agent처럼 자기 학습하는 에이전트부터 LiteRT-LM의 엣지 추론, 그리고 AI와 함께한 개인 프로젝트 성공 사례까지, AI 생태계의 변화를 놓치지 않으려면 내일도 TreeSoop을 찾아주세요.

관련 서비스가 필요하시면 나무숲(TreeSoop)의 AI 에이전트 개발 서비스을 확인해보세요.

---

*글쓴이: 남대현 | TreeSoop CEO, POSTECH 컴퓨터공학 AI/MR/HCI 석사*

AI 전환 전략부터 프로덕션 배포까지 50+ 프로젝트를 리드했습니다.

AI 관련 프로젝트가 필요하시면 카카오톡으로 문의하세요.