2026년 5월 23일 AI 뉴스 — 안나스 아카이브, 안티그래비티 2.0, Kanbots
안나스 아카이브가 LLM에게 보낸 호소문, 안티그래비티 2.0의 3D LLM 벤치마크 1위, 카파시 신경망 강의, AI 스크레이퍼와 위키, Kanbots, Models.dev, Superset IDE, Dev.to Gemini Embeddings 사례까지.
오늘은 AI가 콘텐츠 생태계 자체에 미치는 영향이 양쪽 극단으로 드러난 하루다. 한쪽에서는 안나스 아카이브가 LLM에게 직접 호소문을 쓰고, 다른 한쪽에서는 AI 스크레이퍼 때문에 게임 위키 운영자들이 무너지고 있다. 그 사이로 안티그래비티 2.0의 3D 모델링 벤치마크 1위, 카파시의 신경망 강의 시리즈, 칸반 카드마다 에이전트가 일하는 Kanbots, 모든 AI 모델 가격을 모은 Models.dev, 에이전트 시대를 위한 IDE Superset, Dev.to가 Gemini Embeddings로 피드를 새로 짠 사례를 정리했다.
LLM에게 보내는 안나스 아카이브의 호소문
세계 최대 그림자 도서관 안나스 아카이브가 LLM에게 1인칭으로 말을 거는 글을 공개했다. 골자는 두 가지다. 사이트를 무차별 크롤링하는 대신, 안나스가 공식적으로 제공하는 토렌트(전체 메타데이터 + 파일 덤프)와 API를 통해 합법적·효율적으로 데이터에 접근하라는 것, 그리고 이미 안나스 데이터로 학습한 LLM이 있다면 후속 학습과 인프라 유지를 위한 자금을 환원해 달라는 것이다. 글은 기부, 엔터프라이즈 후원, 모네로를 통한 익명 기부 채널까지 함께 안내한다.
원문: https://annas-archive.gl/blog/llms-txt.html
안티그래비티 2.0, 3D 모델링 LLM 벤치마크 1위
ModelRift가 운영하는 OpenSCAD "판테온" 벤치마크에서 구글 안티그래비티 2.0이 자율 모델 중 1위에 올랐다. 평가 항목은 포르티코·돔·기둥·원형 회랑의 정확한 비례뿐 아니라 천장 코퍼 패턴 같은 미세 디테일까지 포함됐다. 안티그래비티 2.0이 품질 4.5/5를 받아 Codex 5.5 High(3.0/5), 사람이 개입한 ModelRift(3.8/5)를 모두 앞섰고, Claude Sonnet·Opus, Cursor Composer도 동일 과제에서 비교됐다. 텍스트 프롬프트만으로 건축물을 OpenSCAD 코드로 합성하는 작업이 LLM의 공간 추론 능력을 어디까지 끌어왔는지 보여주는 결과다.
원문: https://modelrift.com/blog/openscad-llm-benchmark/
카파시의 신경망 강의 시리즈, Zero to Hero
안드레이 카파시가 운영하는 nn-zero-to-hero가 다시 상위 트렌드에 올랐다. 총 8개 강의 시리즈로, backprop과 기본 학습 절차부터 시작해 MLP·BatchNorm·CNN을 거쳐 GPT 수준 트랜스포머와 토크나이저까지 직접 코드를 짜며 따라가는 구성이다. 파이썬과 고등학교 수준의 미적분만 있으면 누구나 따라할 수 있고, 강의마다 유튜브 영상·주피터 노트북·연습 문제가 같이 묶여 있다. AI 코딩 도구의 내부에서 무슨 일이 벌어지는지 한 번은 손으로 짜보고 싶은 개발자에게 사실상 표준 자료다.
원문: https://github.com/karpathy/nn-zero-to-hero
AI 스크레이퍼가 위키 운영을 망치고 있다
마인크래프트, OSRS, 리그 오브 레전드 등 대형 게임 위키를 운영하는 Weird Gloop이 직접 쓴 글이다. 운영자가 밝힌 수치만 보면 "전체 서버 문제의 약 95%가 악의적 스크레이퍼 때문"이라는 수준이다. 스크레이퍼들이 사람인 척 위장하고 수천만 개 IP로 위키의 수십억 navigable URL을 동시에 두드리면서 캐싱이 무력화되고, CPU 부하는 평소의 50~100배, 트래픽은 초당 1,000+ 요청까지 튀어 DDoS와 구분이 안 된다. Weird Gloop은 Cloudflare 챌린지와 커스텀 방화벽 룰, HTTP 헤더·ja4 해시 기반 봇 탐지, 그리고 사람의 행동 패턴을 학습한 휴리스틱 시스템으로 대응하고 있다.
원문: https://weirdgloop.org/blog/clankers
카드마다 AI 에이전트가 움직이는 오픈소스 칸반, Kanbots
Kanbots는 칸반 보드의 카드 하나하나에 Claude Code나 Codex 에이전트를 붙여 병렬로 작업을 돌리는 데스크톱 앱이다. 사용자가 폴더를 드롭하면 보드가 자동으로 생성되고, 각 에이전트는 독립된 git 워크트리에서 동작하며 진행 상황이 카드에 실시간으로 표시된다. Autopilot 기능을 켜면 Product Manager·Senior Engineer 같은 페르소나가 작업을 자동으로 분할·병렬 처리하고, 결정이 필요한 순간에만 사용자에게 묻는다. 코드는 로컬을 벗어나지 않는 로컬 우선 설계이며, OSS 데스크톱 버전은 무료, 팀 협업용 클라우드 버전은 월 $19다.
원문: https://www.kanbots.dev/
모든 AI 모델 가격·스펙을 한곳에, Models.dev
Models.dev는 LLM·임베딩·멀티모달 모델의 이름, 가격, 컨텍스트 길이, 지원 기능(툴 호출·추론·파일 첨부 등), 입출력 모달리티를 TOML 포맷으로 모은 오픈소스 데이터베이스다. MIT 라이선스로 공개돼 있고, REST API와 커뮤니티 기여 워크플로를 갖춰서 새 모델이 나올 때마다 PR로 항목이 추가되는 구조다. 라우터·게이트웨이·코딩 에이전트가 모델을 자동 선택할 때 정형 데이터 소스로 그대로 가져다 쓸 수 있다.
원문: https://github.com/anomalyco/models.dev
에이전트 시대를 위한 IDE, Superset
YC P26 출신 Superset이 내놓은 건 정확히는 "에이전트 오케스트레이션 데스크톱"에 가깝다. Claude Code·Codex 등 CLI 기반 코딩 에이전트 여러 개를 동시에 띄우고, 각 작업을 독립된 git 워크트리로 격리해 서로 간섭 없이 병렬로 일하게 만든다. 사람은 여러 에이전트의 상태를 한 화면에서 모니터링하면서 내장 diff 뷰어로 변경 사항을 검토하고, 필요할 때만 익숙한 외부 IDE로 점프한다. 사람이 직접 타이핑하는 단축키와 에이전트에게 위임하는 단축키가 같은 비중으로 설계된 점이 일반 IDE와 가장 다른 부분이다.
원문: https://github.com/superset-sh/superset
Dev.to, Gemini Embeddings로 피드 추천을 다시 짰다
Dev.to 엔지니어링 팀이 피드 알고리즘을 임베딩 기반으로 갈아엎은 과정을 공개했다. 기존 알고리즘은 팔로우·반응·태그 같은 사회 신호 위주여서 "Ruby 3.4 출시" 같은 세부 트렌드를 놓치거나 클릭베이트 에코 챔버를 만드는 문제가 있었다. 새 시스템은 Gemini Embeddings 2로 글과 사용자의 관심사를 같은 벡터 공간에 매핑해, 사용자별 interest_embedding을 PostgreSQL + pgvector에 저장하고 `1 - (embedding <=> user_interest)` 같은 코사인 유사도 식을 SQL 쿼리에 그대로 박는다. 6시간마다 도는 Leader Clustering 기반 TrendDetector가 점수 15 이상의 최근 글을 거리 0.15 안쪽으로 묶고, 클러스터가 10개를 넘기면 Gemini가 자동으로 트렌드 라벨과 요약을 붙인다. 모든 AI 호출은 `Ai::Base`, `Ai::Embedding` 래퍼를 거쳐 `AiAudit`에 모델·호출처·레이턴시·토큰까지 기록돼 비용 추적이 그대로 가능하다.
원문: https://dev.to/devteam/how-were-using-gemini-embeddings-to-build-a-smarter-community-driven-feed-on-dev-1b9f
---
오늘은 AI 모델 자체보다, 그 모델이 어떤 콘텐츠 위에서 학습되고 운영되는지에 대한 이야기가 두드러진다. 안나스 아카이브와 Weird Gloop의 글은 같은 동전의 양면이고, Dev.to의 피드 사례는 임베딩을 프로덕션에 얹는 실전 레퍼런스다. 이런 흐름을 일과 가까운 도구로 묶어 매일 한 잔에 담아 보내는 일은 나무숲의 일과 그대로 이어진다. treesoop.com/services/agentic-ai에서 우리가 어떤 식으로 에이전트 워크플로를 만드는지 볼 수 있다.