2026년 04월 04일 AI 뉴스 — Gemma 4, 멀티모달 AI, 오픈소스 도구

Google Gemma 4 오픈 모델, Qwen3.5-Omni 멀티모달, Mintlify 가상 파일시스템, Mistral Voxtral TTS 등 오늘의 주요 AI 소식을 정리했습니다.

Google, Gemma 4 오픈 모델 공개

Google DeepMind가 Gemma 4 모델 패밀리를 공개했다. 2B에서 31B 파라미터까지 다양한 크기를 지원하며, 멀티모달 입력과 140개 언어를 처리할 수 있다. 로컬 하드웨어에서 직접 다운로드해 파인튜닝할 수 있어 온디바이스 AI 기능 구현에 활용도가 높다.

오픈 웨이트 모델 경쟁이 치열해지는 가운데, Gemma 4는 경량 모델에서도 멀티모달을 지원한다는 점에서 차별화된다.

원문 보기

Mintlify, RAG 대신 가상 파일시스템으로 문서 어시스턴트 구축

Mintlify가 기존 RAG 파이프라인을 폐기하고 가상 파일시스템 기반 아키텍처로 전환했다. Unix 명령어를 DB 쿼리로 변환하는 방식으로, RAG의 고질적인 검색 품질 문제를 근본적으로 해결했다.

문서 기반 AI 어시스턴트를 구축할 때 RAG의 한계를 경험했다면 주목할 만한 접근법이다.

원문 보기

Qwen3.5-Omni: 텍스트, 오디오, 비전을 하나로 통합한 오프라인 모델

Qwen이 텍스트, 오디오, 비전을 단일 모델로 통합한 Qwen3.5-Omni를 공개했다. 완전 오프라인 실행이 가능하며 브라우저에서 직접 데모를 체험할 수 있다.

멀티모달 AI를 자체 하드웨어에서 운영하고 싶은 개발자에게 실질적인 선택지가 됐다.

원문 보기

Mistral, Voxtral TTS 텍스트 음성 변환 모델 공개

Mistral이 새로운 텍스트 음성 변환 모델 Voxtral TTS를 출시하고 온라인 데모를 공개했다. ElevenLabs나 OpenAI TTS와 직접 비교해볼 수 있다.

오픈소스 TTS 시장에 새로운 경쟁자가 등장한 셈이다.

원문 보기

Gemma 4를 브라우저에서 바로 실행하는 WebGPU 데모

WebGPU를 활용해 Gemma 4 경량 모델을 브라우저에서 바로 실행할 수 있는 데모가 공개됐다. 백엔드 서버 없이 클라이언트 사이드에서 AI 추론이 가능하다.

웹 앱에 클라이언트 사이드 AI 기능을 넣고 싶다면 참고할 만한 구현이다.

원문 보기

oh-my-codex: Codex CLI를 위한 플러그인 시스템

OpenAI Codex CLI에 oh-my-zsh 스타일의 플러그인, 훅, 에이전트 오케스트레이션을 추가하는 프로젝트가 하루 만에 GitHub 스타 3,000개를 넘겼다.

AI 코딩 도구의 커스터마이징 수요가 폭발적으로 늘고 있음을 보여주는 사례다.

원문 보기

Onyx: 모든 주요 LLM을 지원하는 오픈소스 AI 플랫폼

RAG, 웹 검색, 코드 실행, 커스텀 에이전트를 통합한 셀프호스팅 AI 플랫폼 Onyx가 주목받고 있다. 벤더 락인 없이 통합 인터페이스를 원하는 팀에게 적합하다.

주요 LLM 프로바이더를 모두 지원하며 자체 인프라에서 운영할 수 있다는 점이 강점이다.

원문 보기

fff.nvim: AI 에이전트와 Neovim을 위한 초고속 파일 검색

AI 에이전트 툴링에 최적화된 고성능 퍼지 파일 검색 도구가 공개됐다. Neovim 플러그인으로 사용하거나 Rust/Node 바인딩을 통해 자체 에이전트에 통합할 수 있다.

에이전트의 파일 탐색 성능이 전체 워크플로우 속도에 직결되는 만큼, 실용적인 도구다.

원문 보기

---

나무숲(TreeSoop)에서 매일 엄선한 AI 뉴스를 전해드립니다. 내일도 찾아와 주세요.

관련 서비스가 필요하시면 나무숲(TreeSoop)의 NLP/LLM 개발 서비스을 확인해보세요.

---

*글쓴이: 남대현 | TreeSoop CEO, POSTECH 컴퓨터공학 AI/MR/HCI 석사*

AI 전환 전략부터 프로덕션 배포까지 50+ 프로젝트를 리드했습니다.

AI 관련 프로젝트가 필요하시면 카카오톡으로 문의하세요.