2026년 6월 25일 AI 뉴스 — LLM 추론칩, 클로드 태그, 오픈 이미지 모델

오픈AI·브로드컴 LLM 추론칩 할라피뇨, 앤트로픽 클로드 태그, Krea 2 이미지 모델, 병렬 에이전트 개발환경 Orca 등 오늘의 AI 뉴스 8선.

오늘의 AI 뉴스를 한눈에 정리했습니다. 오픈AI의 첫 자체 추론칩부터 슬랙에 들어온 AI 동료, 오픈웨이트 이미지 모델, 그리고 코딩 에이전트를 병렬로 굴리는 개발환경까지, AI를 매일 쓰는 개발자에게 바로 도움이 되는 소식만 골랐습니다.

오픈AI·브로드컴, 첫 LLM 추론 전용칩 '할라피뇨' 공개

오픈AI가 브로드컴과 함께 자사 첫 커스텀 AI 추론칩 '할라피뇨(Jalapeño)'를 공개했습니다. 범용 GPU가 아니라 LLM 추론에 맞춰 커널, 메모리 이동, 네트워킹, 서빙 패턴까지 바닥부터 설계한 '인텔리전스 프로세서'로, 레티클 크기의 대형 ASIC입니다. 초기 설계부터 테이프아웃까지 단 9개월이 걸렸는데, 이는 고성능 반도체에서 가장 빠른 ASIC 개발 사이클일 수 있다고 회사 측은 설명합니다.

흥미로운 점은 칩 개발 과정 자체가 오픈AI의 모델로 가속됐다는 것입니다. 엔지니어링 샘플은 이미 실험실에서 GPT-5.3-Codex-Spark 같은 실제 워크로드를 목표 주파수·전력에서 돌리고 있으며, 전력당 성능이 현재 최고 수준을 크게 웃돈다고 합니다. 2026년 말 초기 배포를 시작해 마이크로소프트 등과 기가와트 규모로 확장할 계획입니다.

원문: https://openai.com/index/openai-broadcom-jalapeno-inference-chip

앤트로픽, 슬랙에 들어온 AI 동료 '클로드 태그' 출시

앤트로픽이 6월 23일 슬랙에서 함께 일하는 AI 팀원 '클로드 태그(Claude Tag)'를 공개했습니다. 채널 안에서 업무를 맡기면 클로드가 작업을 단계별로 쪼개 스스로 진행하고, 승인된 도구·데이터에 접근해 결과를 다시 슬랙으로 가져다줍니다. 사람이 다른 일을 하는 동안 몇 시간에서 며칠에 걸쳐 비동기로 작업하고, 후속 작업까지 스스로 예약합니다.

기업용으로 설계돼 회사 전체가 하나의 클로드 '아이덴티티'를 공유하고, 반쯤 진행한 작업을 동료끼리 넘겨받을 수 있습니다. 앤트로픽은 내부 제품팀 코드의 65%를 자체 버전으로 만들고 있다고 밝혔습니다. 클로드 엔터프라이즈·팀 고객 대상 베타로, Opus 4.8 위에서 동작합니다.

원문: https://www.anthropic.com/news/introducing-claude-tag

Krea 2, 오픈웨이트 텍스트-이미지 모델 공개

Krea가 창작 탐색에 초점을 맞춘 오픈웨이트 텍스트-이미지 디퓨전 트랜스포머 'Krea 2'를 기술 보고서와 함께 공개했습니다. 연구용 비증류 베이스인 K2 Raw와 빠른 소수 스텝 생성에 최적화된 K2 Turbo, 두 체크포인트로 나뉘며 Artificial Analysis 리더보드 상위 10위권에 들었습니다.

스타일 레퍼런스 시스템으로 결과물의 톤과 스타일을 정밀하게 제어할 수 있고, 프롬프트 확장기가 입력을 더 풍부한 캡션으로 매핑합니다. 선호도 최적화와 강화학습을 포함한 다단계 학습 파이프라인이 적용됐고, 오픈웨이트라 실험과 파인튜닝 여지가 큽니다.

원문: https://www.krea.ai/blog/krea-2-technical-report

Orca, 코딩 에이전트를 병렬로 굴리는 개발환경(ADE)

stably.ai의 Orca는 여러 AI 코딩 에이전트를 병렬로 오케스트레이션하는 ADE(Agent Development Environment)입니다. Claude Code, Codex, OpenCode 같은 에이전트를 격리된 git worktree에서 동시에 돌려, 결과를 비교하고 병합할 수 있습니다. "자신의 구독으로 어떤 코딩 에이전트든 돌린다"는 것이 핵심입니다.

데스크톱·모바일 인터페이스에서 통합 터미널, GitHub·Linear 작업 관리를 함께 제공하고, AI가 만든 코드를 커밋 전에 주석을 달며 다듬을 수 있습니다. 단일 에이전트를 넘어 '에이전트 함대'를 일상 개발 흐름에 끌어들이려는 시도입니다.

원문: https://github.com/stablyai/orca

이력서를 채점하는 오픈소스 AI 에이전트, hiring-agent

interviewstreet의 hiring-agent는 PDF에서 구조화된 데이터를 추출하고 GitHub 신호로 보강해 "공정하고 설명 가능한 평가"를 내놓는 이력서 평가 에이전트입니다. PDF를 텍스트로 변환하고 LLM 템플릿으로 섹션을 파싱한 뒤, GitHub 프로필을 가져와 분석하고 오픈소스 기여·기술 역량 같은 항목으로 점수를 매깁니다.

로컬 모델(Ollama)과 클라우드(Google Gemini)를 모두 지원해 배포 방식이 유연합니다. 채용 스크리닝이라는 구체적 반복 업무에 LLM 에이전트를 어떻게 녹이는지 보여주는 실전 레퍼런스가 됩니다.

원문: https://github.com/interviewstreet/hiring-agent

바이두, 원샷 장문 파싱 OCR 모델 'Unlimited-OCR' 공개

바이두가 DeepSeek-OCR을 한 단계 더 밀어붙인 'Unlimited-OCR'을 공개했습니다. 프로젝트가 '원샷 장문(long-horizon) 파싱'이라 부르는 방식으로, 단일 이미지와 여러 페이지짜리 PDF 문서를 하나의 접근으로 처리합니다. 잘라낸 이미지를 위한 'gundam' 모드와 전체 해상도 문서를 위한 'base' 모드를 제공합니다.

Hugging Face Transformers, SGLang 같은 인기 프레임워크와 통합되고 ModelScope·arXiv로도 공개됐으며, GitHub 6.3k 스타로 빠르게 주목받고 있습니다. 페이지를 잘게 쪼개던 기존 방식 대신 장문 문서를 통째로 다뤄 문서 처리 파이프라인을 단순화할 수 있습니다.

원문: https://github.com/baidu/Unlimited-OCR

Moebius, 0.2B 모델로 10B급 이미지 인페인팅

Moebius는 0.22B 파라미터의 가벼운 이미지 인페인팅 모델로, FLUX.1-Fill-Dev 같은 10B급 모델의 생성 품질에 맞먹거나 이를 능가한다고 주장합니다. 공간·의미 정보를 고정 크기 행렬로 압축해 연산 부담을 줄이는 LλMI(Local-λ Mix Interaction) 블록과, 큰 교사 모델의 지식을 잠재 공간 안에서만 전이하는 적응형 다중 입도 증류 전략이 핵심입니다.

그 결과 경쟁 모델 대비 파라미터를 2% 미만으로 쓰면서도 추론 속도는 15배 이상 빨라졌습니다. 로컬·온디바이스 환경에서 이미지 편집을 돌리려는 쪽에 매력적인 선택지입니다.

원문: https://hustvl.github.io/Moebius/

Haystack, 프로덕션용 에이전트·RAG 오케스트레이션 프레임워크

deepset의 Haystack은 프로덕션을 겨냥한 오픈소스 AI 오케스트레이션 프레임워크입니다. 에이전트와 RAG 애플리케이션을 구축하면서 "AI가 내리는 모든 결정을 들여다보고 디버깅·최적화"할 수 있는 가시성을 강조합니다. OpenAI·Anthropic·Mistral 등 주요 공급자와 다양한 데이터베이스를 연동합니다.

조합 가능한 빌딩 블록은 쿠버네티스를 포함한 여러 환경에서 동작하고, 직렬화 가능한 파이프라인과 내장 관측성, 엔터프라이즈 지원까지 제공합니다. 프로토타입을 넘어 실제 서비스 운영 단계까지 가져가려는 팀에 유용합니다.

원문: https://haystack.deepset.ai/

---

매일 아침 엄선한 AI 뉴스를 받아보고 싶다면 나무숲과 함께하세요. 오늘도 좋은 하루 되시길 바랍니다.