Monday, March 30, 2026

Claude 차세대 모델 유출, Google 동시통역 이어폰

AI Dub - 2026.03.30

AI Dub

2026.03.30 — TurboQuant 충격파, Mythos 유출, Google 동시통역 이어폰

하드웨어 · 인프라

TurboQuant · DRAM 위기 · Jeff Dean

Google TurboQuant — 논문 한 편이 DRAM 산업을 뒤흔들다 — 3/24 공개된 무료 논문. 코드 없이 수학만. 48시간 내: SanDisk -11%, Micron -7%, Samsung -5%. DDR5 킷 $100 하락. 핵심: PolarQuant(극좌표 변환) + QJL(1-bit 잔차 보정)로 KV-cache를 3bit 압축, 정확도 손실 0%. 커뮤니티가 24시간 내 구현체 3개 제작. 70B 모델을 Mac Mini 16GB에서 돌릴 수 있다. ICLR 2026에서 발표 예정. 분석↗ [상세 ↓]

OpenAI가 촉발한 DRAM 대란 — Sam Altman이 삼성·SK에 동시 계약(글로벌 공급 40% 잠금). LOI였지 바인딩 아니었는데 시장은 실제로 반응. DDR5 +171%. Stargate 확장 취소. 그런데 DRAM 가격을 실제로 떨어뜨린 건 계약 철회가 아니라 Google의 무료 논문. "한 회사는 40% 공급을 잠갔고, 다른 회사는 논문을 냈다. 논문이 이기고 있다." 원문↗ [상세 ↓]

Jeff Dean: 도구가 인간 속도에 맞춰져 있다 — AI 에이전트는 50x 빠르지만 의존하는 도구는 그대로. 모델이 무한히 빨라져도 전체 개선은 2~3x. Amdahl의 법칙. 원문↗

보안 · AI 위험

Anthropic Mythos · 사이버보안 주가 폭락

Anthropic Mythos 유출 — "Step Change" 모델이 보안 업계를 공포에 빠뜨리다 — CMS 설정 실수로 ~3,000개 Anthropic 비공개 자산이 노출. 발견된 내부 문서: Claude Mythos, Opus 위 "Capybara" 티어, "가장 강력한 모델". 라이브 데모에서 Ghost(GitHub 5만 스타, 역대 크리티컬 취약점 0건)에서 90분 만에 blind SQL injection 제로데이 발견. 사이버보안 주가 즉각 반응: PANW -7%, CRWD -6.4%, ZS -5.8%, FTNT -4%. 보안 특화 모델이 보안 사고로 공개된 아이러니가 밈화. 원문↗ [상세 ↓]

더빙 · 비디오 · 음성

Google 동시통역 · Voxtral TTS · VibeVoice ASR · Kokoro · Voice Agent

Google 동시통역 이어폰 — 헤드폰이 개인 통역사가 되다 — Google Translate "Live Translate"가 iOS에 공식 출시. 아무 블루투스 이어폰을 연결하면 70+ 언어 실시간 양방향 통역. Gemini AI 기반. 2.7억 사용자 즉시 접근 가능. @cgtwts(1,393♥): "Google just killed Duolingo." 수년간 학습하거나 수천 달러 지불해야 했던 언어 장벽이 무료 앱 업데이트로 사라졌다. 더빙 산업에 직접적 영향: 실시간 통역이 소비자 기본 기능이 되면, 더빙의 가치는 '통역'에서 '연기·감정 전달'로 이동한다. 공식↗ [상세 ↓]

Mistral Voxtral TTS — 3초 참조로 다국어 음성 합성 — Ministral 3B 기반 4B TTS. 표현력 있는 다국어 음성 생성. 9개 언어. 70ms 지연, 9.7x RTF. ElevenLabs Flash v2.5 대비 68.4% 선호율. 더빙 파이프라인에서 즉시 활용 가능. 원문↗ [상세 ↓]

MS VibeVoice ASR — 오픈소스 음성 AI 프론티어 — 60분 오디오 단일 패스. 화자 식별(Who) + 타임스탬프(When) + 전사(What) 통합. 9B 파라미터, MIT 라이선스. 50+ 언어. TTS도 300ms TTFA. 원문↗

Kokoro TTS → Apple Silicon M4 로컬 — ElevenLabs 대신 로컬 Kokoro TTS. 100ms TTFA. 비용 $0. 품질 충분. 원문↗

Voice Agent 실전 사례 폭증 — 배관업체 AI 음성 에이전트로 100% 응답. ElevenLabs에서 Gemini→Claude 스왑 시 성공률 15% 증가. "4일 전만 해도 온라인 서비스 알아봤는데 이제 내 로컬 에이전트가 있다." 원문↗

모델 · 벤치마크

DeepSeek V4 · Gemma 4 · Qwen3.5

DeepSeek V4 벤치마크 유출 — ~200B Lite 버전, 1M 토큰 컨텍스트, 멀티모달. HumanEval ~90%, SWE-bench 80%+. Claude Opus·GPT-5.3 능가 주장. 미확인·미검증. r/LocalLLaMA 2,316 업보트 스레드에서 AIME 99.4%는 "불가능"으로 판정. 출시일 계속 연기 중. 원문↗ [상세 ↓]

Google Gemma 4 아레나 등장 — "significant otter" 가명으로 테스트 중. 2B, 4B dense + 120B total/15B active MoE 변형. 곧 공식 발표 예상. 원문↗

Qwen3.5-9B-Uncensored — 500K+ 다운로드. GGUF 지원. 영어+중국어+다국어. 제한 없는 오픈소스 모델. 원문↗

0xSero: 24GB에 SOTA급 모델 — 6x 큰 모델과 동등. Gemini Deep Think·DeepSeek과 Math에서 동점. 로컬 추론의 실용 영역 확대. 원문↗

Claude · 에이전트

OpenClaw MCP · RTK · Karpathy · Boris Cherny

OpenClaw → MCP 서버 — 에이전트 메시징의 게임 체인저 — 9개 MCP 도구. Claude Code/Codex/Cursor 어디서든 Slack/Telegram/Discord 1홉 접근. PR #50396(HTTP/SSE 원격 연결), #54957(영속 서버), #49182(암호화 서명). "AI 부분은 상품화됐다. 어려운 건 50+ 메시징 어댑터." 원문↗ [상세 ↓]

Karpathy autoresearch — ML 논문 접근으로 3.2% 개선 — 630줄 파이썬 스크립트, 21K+ 스타. ~12 실험/시간, ~100 실험/밤. 나노챗(이미 Karpathy가 최적화)을 GPT-2 학습 2.02h→1.80h로 11% 단축. Shopify CEO Tobi Lutke가 Liquid 엔진에 적용: 렌더링 53% 빨라짐, 메모리 할당 61% 감소. 원문↗

Boris Cherny(Claude Code 제작자)의 실전 워크플로 — 매일 10~15개 Claude 세션 병렬 실행. 핵심: CLAUDE.md 파일에 실수할 때마다 규칙 추가 → "같은 실수 다시 안 함." 6개월 이상 SQL 한 줄 안 쓰고 Claude가 BigQuery 직접 조회. Claude Code가 현재 전체 공개 GitHub 커밋의 4% 차지. 원문↗

RTK(Rust Token Killer) — Claude Code 토큰 60% 절감 — 노이즈 제거, 반복 콘텐츠 병합, 무의미한 공백·진행바 삭제. 오픈소스. 원문↗

A-Evolve — 에이전틱 AI의 PyTorch 모먼트 — 수동 튜닝을 자동 상태 변이와 자기 교정으로 대체. "대부분의 에이전트 스택은 실패한다. 이것이 고친다." 원문↗

오픈소스 · 기타

Ladybird · Translumo · Alibaba Accio

Ladybird — 10년 만에 처음, 브라우저를 처음부터 새로 — Chromium 포크 아님. 1,200+ 기여자. LibWeb, LibJS, LibWasm 전부 새로 작성. 61K+ 스타. "한 엔진이 웹을 지배하면, 한 회사가 웹을 결정한다." 원문↗

Translumo — 실시간 화면 번역 — 게임, 영상, 자막의 텍스트를 실시간 감지·번역. 오픈소스. 원문↗

Alibaba Accio — AI가 공급업체와 제품을 찾아주는 에이전트 — 자연어 한 문장으로 B2B 소싱. 규격, 인증, 가격 범위까지 맞춤 필터. 원문↗

TAKEAWAY

1. 논문 한 편 > 조 단위 계약 — Google TurboQuant(무료 논문)가 OpenAI의 40% DRAM 공급 잠금보다 가격에 더 큰 영향. 기초 연구가 산업을 뒤집는 교과서적 사례.

2. AI가 보안을 찾는 시대 — Mythos가 Ghost에서 90분 만에 제로데이를 찾았다. 인간 보안 연구자의 수개월 작업이 AI 90분으로 압축. 사이버보안 산업의 구조적 전환 신호.

3. 더빙의 가치가 이동한다 — Google이 아무 이어폰에서 70+ 언어 실시간 통역을 무료로 풀었다. 더빙의 가치는 더 이상 '언어 장벽 제거'가 아니다. 기계가 못 하는 것 — 감정, 연기, 문화적 뉘앙스 — 이 유일한 차별점이 된다.

▼ 상세 분석 보기 ▼

각 뉴스의 배경 · 맥락 · 의미 · 전망

Sources: Twitter bookmarks (92) · Monitor search · Reddit · WebSearch · HuggingFace · Fortune

DEEP DIVE

각 사안의 배경 · 맥락 · 의미 · 전망

하드웨어 · 인프라

Google TurboQuant — 수학 논문이 반도체 산업을 흔들다

3월 24일 Google이 공개한 TurboQuant는 LLM KV-cache를 3bit로 압축하면서 정확도 손실 0%를 달성하는 알고리즘이다. 핵심은 PolarQuant(벡터를 극좌표로 변환)와 QJL(1-bit 잔차 에러 보정)의 조합. TechCrunch는 "Silicon Valley의 Pied Piper"라 불렀다. H100에서 attention logits 8x 속도 향상. Gemma, Mistral 모델에서 검증. 재훈련 불필요. Morgan Stanley는 "Jevons 역설로 오히려 컴퓨팅 수요 증가"를 경고하지만, 더빙 파이프라인에 의미가 크다: ASR(VibeVoice 9B) + LLM(번역) + TTS를 단일 워크스테이션에서 돌리는 것이 현실적이 된다. ICLR 2026(다음 달) 발표 예정.

OpenAI DRAM 위기 — 의향서 한 장의 나비효과

@aakashgupta의 분석(9,307♥, 1M views)이 전체 그림을 그린다. 2025년 10월 Sam Altman이 삼성과 SK하이닉스를 동시 방문해 월 90만 장 DRAM 웨이퍼 계약(글로벌 공급 40%). 양사 모두 상대방의 계약을 몰랐다. LOI(의향서)였지만 시장은 실거래로 반응: DDR5 64GB 킷 $190→$700(+171%). Stargate Abilene 확장 취소, Bloomberg $5000억 프로젝트 미착수 보도. 그런데 DRAM 가격을 실제로 떨어뜨린 건 OpenAI의 계약 철회가 아니라 Google의 무료 논문(TurboQuant)이었다. SK하이닉스 -6%, 삼성 -5%, Corsair 킷 $60-100 하락. 산업 구조를 쥐고 흔든 건 공급망 계약이 아니라 기초 연구였다.

보안 · AI 위험

Anthropic Mythos — 보안 특화 모델이 보안 사고로 유출되다

3/26~27 사이 Anthropic CMS 설정 실수로 ~3,000개 비공개 자산이 암호화 없이 검색 가능한 DB에 노출. 캠브리지 사이버보안 연구자 Alexandre Pauwels와 LayerX의 Roy Paz가 독립적으로 발견. Fortune이 단독 보도. 내부 문서에 따르면: (1) Claude Mythos는 Opus 위 "Capybara" 티어, (2) "지금까지 가장 강력한 모델", (3) "역량의 단계적 변화(step change)". 라이브 데모에서 Ghost CMS(GitHub 5만 스타, 역사상 크리티컬 취약점 0건)에서 90분 만에 blind SQL injection 제로데이를 발견. 비공개 블로그 초안은 "전례 없는 사이버보안 위험"을 경고하며, 초기 접근을 사이버 방어 조직에 제한할 것이라 명시. r/LocalLLaMA와 HN에서는 "의도적 마케팅 유출" 의혹과 "진짜 우려" 사이에서 의견이 갈렸다. 분명한 것: AI의 보안 취약점 발견 속도가 인간을 완전히 추월하고 있다.

더빙 · 음성

Google 동시통역 이어폰 — 더빙 산업이 답해야 할 질문

3/27 Google 공식 발표(7,032♥): Google Translate의 "Live Translate" 기능이 아무 블루투스 이어폰에서 작동한다. Pixel Buds 전용이 아니다. iOS + Android, 70+ 언어, Gemini AI 기반. @cryptopunk7213(974♥): "270 million people can now understand 70+ different languages in real-time via Gemini AI audio translation." @cgtwts(1,393♥): "Google just killed Duolingo." @mungchi(472♥)는 이번 달 Google 발표를 종합하면서 이어폰 통역을 첫 번째로 꼽았다. 더빙 산업에 이것이 의미하는 바: 실시간 통역이 무료 앱 업데이트로 2.7억 사용자에게 풀린다. 수년간 학습하거나 수천 달러를 지불해야 했던 언어 장벽이 사라진다. 더빙의 가치는 이제 '무슨 말을 하는가'(통역)가 아니라 '어떻게 말하는가'(연기, 감정, 문화적 뉘앙스)로 이동한다. Voxtral TTS(3초 참조 클로닝), VibeVoice ASR(60분 단일 패스), Kokoro(로컬 100ms TTFA)가 이 스택의 오픈소스 구현체다. 파이프라인은 갖춰졌다. 남은 차별화 요소는 인간만이 할 수 있는 연기와 감정 전달이다.

Voxtral TTS — 오픈웨이트 TTS의 새 기준

Mistral의 Voxtral TTS는 Ministral 3B 기반 4B 모델로, speech를 semantic tokens(콘텐츠)와 acoustic tokens(음색·프로소디·스타일)로 분리해 각각 다른 모델로 처리한다. Voxtral Codec으로 ultra-low bitrate 토큰 압축. 70ms 모델 지연, 9.7x RTF(사람 말 속도의 ~10배). 9개 언어. ElevenLabs Flash v2.5 대비 68.4% 선호율이 핵심 — 오픈웨이트가 상용 API를 품질에서 이기기 시작했다. 여기에 Kokoro TTS(Apple Silicon 로컬, $0, 100ms TTFA)까지 더하면 상용 TTS API 의존도를 0으로 낮출 수 있다. 더빙 파이프라인에서 TTS 비용이 사실상 사라지는 시대.

모델 · 벤치마크

DeepSeek V4 — 확인되면 판이 바뀐다

유출된 수치: ~200B Lite, 1M 컨텍스트, 멀티모달, HumanEval ~90%, SWE-bench 80%+. 하지만 AIME 99.4%는 r/LocalLLaMA에서 "불가능"으로 판정(최대 점수 120/120 = 100%). 이 한 지표의 비현실성이 전체 유출 신뢰도를 훼손. 출시일은 2월 설→3월 초→3월 중→4월→"곧"으로 계속 연기. NDA 하에 일부 제공사에 선공개 중. @kimmonismus의 시각이 중요: "Meta의 장점은 LLM이 SOTA일 필요가 없다는 것. 99%의 유저에게 충분하면 된다." 더빙 관점에서도 동일: 번역 LLM이 SOTA일 필요 없다. 병목은 TTS와 립싱크다.

Claude · 에이전트

OpenClaw MCP — 에이전트가 메시지를 보내는 세상

오스트리아 개발자 Peter Steinberger(@steipete)의 OpenClaw가 MCP 서버가 되면서, Claude Code에서 messages_send 한 번으로 Slack/Telegram/Discord/WhatsApp 메시지를 보낼 수 있게 되었다. @michael_chomsky(1,003♥)의 해설: 이전엔 Custom WebSocket, self-signed TLS, 헬스체크 폴링 등 수천 줄 코드 필요 → 이제 MCP config에 추가만 하면 끝. 주목할 세 PR: #50396(HTTP/SSE — 원격 연결 가능, "the big one"), #54957(영속 MCP 서버), #49182(암호화 서명). HTTP 트랜스포트가 안정화되면 "AI 파트가 아니라 메시징 어댑터가 상품"이 되는 구조적 전환이 완성된다. 에이전트 간 협업이 Slack/Discord를 통해 자연스럽게 일어나는 세상이 임박.

AI Dub · 2026.03.30 · [email protected]

𝕏 Twitter LinkedIn Threads

← All newsletters