2026년 06월 10일 AI 뉴스 — 애플의 제미나이 전환, 샤오미 1조 모델

애플이 WWDC 2026에서 애플 인텔리전스를 구글 제미나이 위에 재구축했다. 샤오미의 초당 1000토큰 1조 모델, xAI의 GPU 임대업 변신, AI 코딩 생산성의 현실까지 오늘의 AI 뉴스 8선.

오늘 AI 업계의 가장 큰 화두는 단연 애플의 WWDC 2026이었다. 애플은 자체 모델 대신 구글 제미나이와 손잡았고, 샤오미는 평범한 8-GPU 노드에서 초당 1000토큰을 뽑는 1조 파라미터 모델을 공개했으며, xAI는 프런티어 랩보다 GPU 임대업체에 가까워졌다는 날카로운 분석이 나왔다. 매일 AI를 쓰는 개발자가 챙겨야 할 8가지 소식을 정리했다.

애플, AI 두뇌를 구글 제미나이에 맡기다

애플이 WWDC 2026에서 구글과 공동 개발한 제미나이 기반 파운데이션 모델 위에 애플 인텔리전스를 다시 구축했다고 발표했다. 새 아키텍처는 온디바이스와 프라이빗 클라우드 컴퓨트 양쪽에서 동작하며, 실행 중인 앱과 사용자 맥락에 맞춰 응답을 조율하는 시스템 오케스트레이터가 기능을 통합 관리한다. 사실적인 이미지 생성, 고급 사진 편집, 비주얼 질의응답, 음성 생성이 새 기능으로 추가됐다. 애플은 "사용자 데이터는 즉각적인 요청 처리에만 쓰이고 애플이나 제3자가 접근할 수 없다"며 외부 검증까지 받는 프라이버시 우선 설계를 강조했다.

원문 보기

환골탈태한 새 시리 전격 공개

새 시리는 대화형 상호작용, 개인 맥락 인식, 여러 앱에 걸친 작업 실행이라는 "완전히 새로운 능력"을 갖췄다. 비주얼 인텔리전스는 카메라로 주변을 비추면 검색·질문·행동을 수행하게 해주고, 사진 앱에는 촬영 후 구도를 바꾸는 스페이셜 리프레이밍, 가장자리를 확장하는 Extend, 개선된 클린업 도구가 들어왔다. 글쓰기 보조는 기기 전반에 통합돼 시리가 사용자 문체에 맞춰 초안을 작성하거나 피드백을 주고, 어디서든 문법 검사를 지원한다. 오랫동안 뒤처졌다는 평을 받던 시리가 이번 개편으로 단순 음성 비서를 넘어 화면 맥락을 이해하는 에이전트에 가까워졌다.

원문 보기

애플, 개발자용 Core AI 프레임워크 공개

애플은 iOS·macOS 등 자사 플랫폼 앱에 ML·AI 기능을 직접 넣을 수 있는 공식 프레임워크 Core AI를 함께 내놨다. 개발자는 깊은 ML 전문성 없이도 자연어 처리, 컴퓨터 비전, 예측 분석, 온디바이스 모델 추론 같은 지능형 기능을 앱에 붙일 수 있다. 애플 하드웨어를 활용해 데이터를 기기 밖으로 보내지 않는 효율적이고 프라이버시 친화적인 AI 처리를 지향한다는 점이 핵심이다.

원문 보기

샤오미 MiMo, 초당 1000토큰 1조 모델

샤오미가 모델-시스템 공동 설계로 초당 약 1000토큰을 달성한 1조 파라미터 모델 MiMo-V2.5-Pro-UltraSpeed를 공개했다. MoE 레이어의 FP4 양자화와, 블록 단위 마스크 병렬 예측으로 토큰 수용률을 높인 새로운 스페큘레이티브 디코딩 기법 DFlash를 결합한 결과다. 단일 8-GPU 노드의 평범한 GPU에서 구동되며, 샤오미 모델팀과 TileRT 추론 인프라팀의 "극한의 코디자인"으로 배포를 실현했다. 대규모 모델은 느리다는 통념을 깨는 결과로, 지연에 민감한 실시간 AI 애플리케이션 팀이라면 벤치마크해 볼 가치가 있다.

원문 보기

xAI, 프런티어 랩에서 GPU 임대업으로

마틴 앨더슨은 xAI가 프런티어 AI 개발보다 GPU 임대 수익을 우선하고 있다고 분석한다. xAI는 300MW 용량을 앤트로픽에 월 12억 5천만 달러, 11만 장의 GPU를 구글에 월 9억 2천만 달러에 임대하는 계약을 맺었는데, 이는 18개월이면 구축 비용을 전액 회수하는 규모다. 업계 전반의 GPU 공급 부족과 맞물려, xAI가 잉여 데이터센터 용량을 Grok 개발에 투자하기보다 현금화하고 있다는 지적이다. 결과적으로 회사는 프런티어 랩보다 인프라 중심의 부동산 사업에 가까워지고 있으며, AI 인프라 비용을 설계하는 입장에선 주목할 흐름이다.

원문 보기

AI코딩 "빨라진 느낌" 실제론 더 느렸다

LLM이 만들어내는 생산성은 측정 가능한 향상이 아니라 심리적 만족에서 온 착각일 수 있다는 주장이다. 한 연구에서 엔지니어들은 24% 더 빠르다고 느꼈지만 객관적으로는 19% 더 느렸는데, 정작 대부분의 개발자는 이 인식-현실의 간극을 스스로 알아채지 못한다. 근본 문제는 생산성을 오로지 코딩 속도로만 재정의하면서 유지보수 부담, 코드 품질, 역량 성장, 애초에 옳은 제품을 만들었는지를 무시한다는 데 있다. PR 속도나 작업 완료가 아니라 장기적 영향을 보는 "총체적 시각"이 진짜 생산성이라는 결론이다.

원문 보기

AI 록스타가 싸지른 코드 뒤치다꺼리

제시 스키너는 AI가 양산한 지저분한 코드베이스를 다루는 실전 전략을 제시한다. 첫째, AI를 자율로 두지 말고 "엔지니어링을 주도하며 LLM이 한 번에 작은 조각만 생성하도록 유도"해 시스템 일관성을 지킬 것. 둘째, 속도보다 이해를 우선해 결과물이 헷갈리면 "브레이크를 밟고" 천천히 품질을 확보할 것. 셋째, 과잉 설계에 맞서 "아키텍처가 문제의 복잡도와 맞을 때까지" 반복해 단순화할 것. 사려 깊은 인간의 안내가 있어야 AI가 훗날 팀이 풀어야 할 유지보수 불가능한 기술 부채를 쌓지 않는다는 게 핵심 메시지다.

원문 보기

코드로 짜는 브라우저 자동화 Intuned

YC S22 출신 Intuned는 수작업 스크립팅을 없애고, 프로덕션급 코드를 생성·배포·유지하는 AI 에이전트를 갖춘 코드 우선 브라우저 자동화 플랫폼이다. 인증, 봇 탐지, 스케일링 같은 까다로운 요구사항을 대신 처리해, 개발자는 보일러플레이트 대신 "무엇을 할지" 기술하는 데 집중할 수 있다. 전자상거래·채용·정부 포털의 데이터 추출, 다중 페이지 크롤링, 폼 제출 같은 RPA, 그리고 결정론적 로직과 LLM을 결합한 AI 워크플로우가 주요 활용처다.

원문 보기

---

나무숲은 이렇게 매일 AI 뉴스를 큐레이션해 전한다. 더 빠르게 받아보고 싶다면 treesoop.com을 확인해 보자.