2026년 6월 12일 AI 뉴스 — Fable 가드레일 논란, AI 노린 코드 함정, 독일 AI Overviews 판결

보안연구자들의 Fable 가드레일 불만, 앤트로픽 30일 데이터 보존 정책, AI 에이전트 겨냥 라이브러리 함정, 독일 법원의 AI Overviews 책임 판결 등 오늘의 AI 뉴스 8선.

오늘의 AI 뉴스는 보안과 신뢰를 둘러싼 이슈가 중심입니다. 앤트로픽의 Fable 가드레일 논란과 30일 데이터 보존 정책, AI 코딩 에이전트를 겨냥한 오픈소스 함정 사건, 그리고 독일 법원의 AI Overviews 책임 판결까지 — AI를 매일 쓰는 개발자가 알아야 할 8가지 소식을 정리했습니다.

보안연구자들, Fable 가드레일에 불만

앤트로픽이 6월 9일 공개한 모델 Fable의 과도한 보안 가드레일에 사이버보안 전문가들의 비판이 이어지고 있습니다. IBM X-Force의 발렌티나 팔미오티는 "블로그 포스트 읽기 같은 무해한 작업도 거부한다"며 필터가 키워드 기반으로 작동하는 것 같다고 지적했습니다.

Fable의 가드레일은 악성코드·생물무기 개발 방지를 목표로 광범위한 필터링을 적용하는데, 그 과정에서 정당한 보안 연구 작업까지 막히는 게 문제입니다. 보안 베테랑 매트 수이케는 "초기 단계라 시간이 지나면 개선될 것"이라는 낙관론을 보였고, 앤트로픽은 아직 공식 입장을 내지 않았습니다. 보안 인접 업무에 Fable을 도입할 계획이라면 이런 제약을 먼저 파악해 둘 필요가 있습니다.

원문: https://techcrunch.com/2026/06/10/cybersecurity-researchers-arent-happy-about-the-guardrails-on-anthropics-fable/

앤트로픽, Fable·Mythos에 30일 데이터 보존 의무화

앤트로픽이 6월 9일부터 Mythos 5, Fable 5 같은 고성능 모델에 대해 "신뢰·안전 목적으로 프롬프트와 출력을 30일간 보존"하는 정책을 시행합니다. Zero Data Retention 계약 기업과 AWS Bedrock·Google Cloud 경유 사용자 등이 대상이며, 소비자 플랜(Claude Free/Pro/Max)은 영향을 받지 않습니다.

보존 이유는 Best-of-N 탈옥이나 국가 단위 스파이 활동 같은 대규모 오용 패턴이 여러 요청을 묶어 분석해야만 감지되기 때문이라고 합니다. 승인된 검토자만 접근 가능하고 모든 접근이 변조 방지 로그에 남으며 30일 후 자동 삭제되지만, 민감 데이터를 다루는 조직이라면 모델 전환 전에 사내 데이터 정책과 충돌하지 않는지 점검해야 합니다.

원문: https://support.claude.com/en/articles/15425996-data-retention-practices-for-mythos-class-models

AI 에이전트 노린 라이브러리 함정, Jqwik 사건

오픈소스 테스트 라이브러리 Jqwik의 메인테이너 요하네스 링크가 5월 25일 릴리스한 1.10.0 버전에 AI 코딩 에이전트를 겨냥한 프롬프트 인젝션("이전 명령을 무시하라"로 시작)을 심어 논란이 됐습니다. 대규모 생성형 AI가 오픈소스 커뮤니티를 파괴한다는 항의의 표시였습니다.

커뮤니티 반응은 양극으로 갈렸습니다. 윤리적 입장을 지지하는 쪽과 "악의적 행동"이라며 법적 위협까지 제기한 쪽이 충돌했고, 링크는 결국 1.10.1에서 표현을 완화하고 Maven Central에 원본 버전 삭제를 요청했습니다. AI 에이전트로 코드를 작성하는 팀이라면, 의존성에 숨은 anti-AI 페이로드가 생성 코드를 오염시킬 수 있다는 점에서 의존성 감사가 새로운 보안 과제로 떠올랐습니다.

원문: https://blog.johanneslink.net/2026/06/09/the-jqwik-anti-ai-affair/

AI 보안 스캔, 10주 만에 실제 버그 17개 발견

구글 중앙 팀이 운영하는 AI 기반 보안 스캐닝을 Perfetto 프로젝트에 적용해 10주 동안 17개의 실제 버그를 찾아낸 경험담이 공유됐습니다. 경계값 검사 오류 10개, 사용 후 해제(use-after-free) 5개, 스택 오버플로우 1개, 접근 제어 오류 1개로, 4건은 실제로는 실행 불가능한 것으로 판명됐습니다.

주목할 점은 리포트 품질입니다. 보고서마다 공격자 모델과 수정안까지 제시될 정도로 잘 작성됐고, 대부분 기계적으로 수정 가능했지만 일부는 오래된 설계 결함을 드러내 근본적인 구조 개선으로 이어졌습니다. 보안에 중요하지만 그동안 감시받지 못한 코드 영역에서 AI 스캐닝이 실질적 성과를 낼 수 있음을 보여주는 사례입니다.

원문: https://lalitm.com/post/perfetto-security-bugs-ai/

Cursor·Windsurf의 시스템 프롬프트 모음 저장소

Cursor, Windsurf, Devin AI, Perplexity, v0, Replit 등 30개 이상의 AI 코딩 도구에서 추출한 시스템 프롬프트와 내부 도구 정의를 모아 둔 저장소가 스타 14만 개를 넘기며 다시 주목받고 있습니다. 도구별 폴더로 정리되어 있어 상용 에이전트들이 어떻게 설계됐는지 들여다볼 수 있습니다.

자체 에이전트를 만들거나 프롬프트를 다듬는 개발자에게 좋은 참고 자료이며, 역으로 자기 제품의 프롬프트가 이렇게 추출될 수 있다는 보안 경고이기도 합니다.

원문: https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools

멀티 에이전트의 공유 두뇌, Hivemind

Claude Code, Codex, Cursor 등 여러 AI 에이전트가 학습한 패턴을 공유하게 해 주는 메모리 시스템 Hivemind가 공개됐습니다. 한 에이전트가 해결한 문제의 패턴을 포착해 재사용 가능한 SKILL.md 파일로 자동 변환하고 팀 전체에 전파하는 '포착 → 체계화 → 전파 → 복합' 구조입니다.

어휘·의미 하이브리드 검색, 세션 요약 자동 생성, 팀 규칙 공유 기능을 갖췄고, LoCoMo 벤치마크에서 비용 25% 절감, 토큰 1.7배 감소를 달성했다고 합니다. npm 명령 한 줄로 설치되며 S3·GCS 등 자체 클라우드에 데이터를 보관하는 BYOC 옵션도 지원합니다.

원문: https://github.com/activeloopai/hivemind

LLM을 밑바닥부터 만드는 실습 가이드

데이터 다운로드부터 텍스트 생성까지, LLM을 처음부터 직접 학습시키는 단계별 가이드가 공개됐습니다. PyTorch 트랜스포머 구현으로 단일 GPU에서 1,300만 매개변수 모델부터 시작해, The Pile 데이터셋 기반 사전훈련을 거쳐 SFT, 보상 모델, PPO/DPO/GRPO 같은 정렬 기법까지 다룹니다.

각 단계에 상세한 코드 설명이 붙어 있고 Streamlit UI와 MkDocs 문서도 제공됩니다. 파인튜닝에 들어가기 전에 전체 스택이 어떻게 굴러가는지 이해하고 싶은 개발자에게 좋은 학습 자료입니다.

원문: https://github.com/FareedKhan-dev/train-llm-from-scratch

독일 법원 "AI Overviews 오답은 구글 자신의 발언"

뮌헨 지역법원이 구글 AI Overviews의 거짓 주장에 구글이 직접 책임을 진다고 판결했습니다. AI 요약은 "구글이 자신의 단어와 구조로 작성한" 독립 콘텐츠이지 단순한 검색 결과 목록이 아니므로, 전통적 검색엔진의 책임 제한 규정이 적용되지 않는다는 논리입니다.

이번 소송은 AI Overviews가 두 출판사를 사기 업체와 연결 짓는 거짓 답변을 내놓으면서 시작됐습니다. "사용자가 직접 출처를 확인하면 된다"는 구글 변론은 "사용자는 거의 출처를 확인하지 않는다"는 연구 결과와 함께 기각됐습니다. 구글뿐 아니라 ChatGPT 등 AI 답변을 제공하는 모든 서비스에 영향을 줄 수 있는 선례라, AI 검색·답변 기능을 제품에 넣는 팀이라면 주시할 필요가 있습니다.

원문: https://the-decoder.com/landmark-german-ruling-declares-googles-ai-overviews-are-googles-own-words-and-makes-it-liable-for-false-answers/

---

나무숲(TreeSoop)은 매일 아침 AI 뉴스를 큐레이션해 전합니다. 카카오톡 오픈채팅 "매일 AI News"에서 매일 아침 받아보세요.