LLM이 틀리는 곳을 CNN이 고친다 — Interfaze의 하이브리드 아키텍처

LLM이 틀리는 곳을 CNN이 고친다 — Interfaze의 하이브리드 아키텍처

OCR(광학 문자 인식)이나 음성 인식 같은 작업을 LLM에 맡겨본 사람이라면 한 번쯤 답답함을 느꼈을 것이다. 모델이 글자를 “대충” 읽고, 그럴듯하게 보정하는 과정에서 원문에 없던 텍스트가 슬쩍 끼어들거나, 아예 다른 숫자로 둔갑하는 경우다. Interfaze는 바로 이 지점을 파고든다. 이 회사가 이번 주 Hacker News에 공개한 글은 간단하지만 도발적인 주장을 담고 있다. “우리는 LLM을 대체하려는 게 아닙니다. … 더 읽기

AI 에이전트에게 규율을 주입하는 법 — Claude Code Superpowers 플러그인

AI 에이전트에게 규율을 주입하는 법 — Claude Code Superpowers 플러그인

Claude Code를 처음 쓰다 보면 패턴 하나를 금방 알아챈다. 요청을 내리면 모델이 즉각 코드 작성에 뛰어든다. 빠르긴 한데, 방향이 틀리거나 맥락을 잘못 잡으면 되돌리는 데 더 많은 토큰이 들어간다. Superpowers는 이 실패 모드를 막겠다는 목적으로 만들어진 오픈소스 플러그인이다. 5월 4일 v5.1.0이 나왔다. Jesse Vincent가 만들고 Prime Radiant 팀이 함께 개발하는 이 프로젝트는 MIT 라이선스로 공개되어 … 더 읽기

Zed + LM Studio + Gemma4 E4B — 로컬 AI 코딩 환경

Zed + LM Studio + Gemma4 E4B — 로컬 AI 코딩 환경

VS Code를 꽤 오래 썼다. 익숙하고, 확장 생태계도 방대하고, 모르는 사람이 없다는 것 자체가 일종의 안전망이었다. 그런데 어느 순간부터 에디터를 켤 때마다 느끼는 묵직함이 쌓이기 시작했다. 탭이 많아질수록 버벅거리고, 설치된 익스텐션들이 서로 충돌하고, 설정 파일은 어느새 수백 줄이 넘어 있었다. 코드를 쓰는 도구인데, 도구를 관리하는 데 시간을 쓰고 있다는 느낌이었다. VS Code에서 Zed로 갈아탄 이유 … 더 읽기

AI가 코드를 빠르게 써줄수록 유지보수는 더 느려진다

AI가 코드를 빠르게 써줄수록 유지보수는 더 느려진다

AI 코딩 에이전트 도입에 관한 논의는 대부분 “얼마나 빠르게 코드를 작성할 수 있는가”를 중심으로 돌아간다. 2배, 5배, 심지어 10배라는 숫자들이 마케팅 문구에 등장하고, 개발팀들은 그 숫자를 근거로 도입을 검토한다. 그런데 애자일(Agile) 소프트웨어 개발의 실천가이자 컨설턴트인 James Shore는 이 질문 자체가 잘못 설정되어 있다고 지적한다. Shore의 글 “You Need AI That Reduces Your Maintenance Costs”는 소프트웨어 … 더 읽기

필즈상 수상자가 ChatGPT 5.5 Pro에게 수학 연구를 맡겨봤더니

필즈상 수상자가 ChatGPT 5.5 Pro에게 수학 연구를 맡겨봤더니

지난 며칠 사이 수학계에서 꽤 조용하지 않은 글 하나가 퍼졌다. 영국 케임브리지 대학교의 수학자이자 필즈상(수학계의 노벨상이라 불리는 최고 권위의 상) 수상자인 Timothy Gowers가 자신의 블로그에 ChatGPT 5.5 Pro와 함께 진행한 수학 연구 실험을 상세히 기록했다. 그 결과는, 솔직히 말하면, 꽤 불편한 느낌을 주는 수준이었다. Gowers가 AI에게 던진 문제는 아무 문제나가 아니었다. 이스라엘 수학자 Mel Nathanson이 … 더 읽기

AI 에이전트에 필요한 건 더 좋은 프롬프트가 아니다

AI 에이전트에 필요한 건 더 좋은 프롬프트가 아니다

AI 에이전트가 말을 안 들을 때 개발자들이 가장 먼저 하는 일은 프롬프트를 고치는 것이다. 지시를 더 명확하게, 더 강하게, 더 길게. “반드시 이 단계를 건너뛰지 마세요”라는 문구가 프롬프트 곳곳에 박힌다. 그런데 어느 순간 그것도 소용이 없어진다. 소프트웨어 엔지니어 Brandon Suh가 최근 올린 글 “Agents need control flow, not more prompts”는 이 막힌 천장을 정면으로 다룬다. … 더 읽기

코드를 읽지 않고 배포한다는 것

코드를 읽지 않고 배포한다는 것

“Claude Code에게 JSON API 엔드포인트를 작성해달라고 하면, 올바르게 작성된다는 걸 안다. 그래서 더 이상 모든 코드를 검토하지 않는다.” 이 문장을 Django 공동 창시자이자 개발자 커뮤니티의 대표적인 목소리인 Simon Willison이 썼다. Willison이 최근 자신의 블로그에 올린 글 제목은 “Vibe coding and agentic engineering are getting closer than I’d like”다. 직역하면 “바이브 코딩과 에이전트 엔지니어링이 내가 원하는 … 더 읽기

AI를 위한 역(逆) 법칙 세 가지

AI를 위한 역(逆) 법칙 세 가지

아이작 아시모프의 로봇 3법칙은 로봇이 지켜야 할 규칙이다. 그런데 AI가 일상 깊숙이 들어온 지금, 정작 규제가 필요한 건 AI가 아니라 AI를 쓰는 인간의 행동 방식일지도 모른다. 소프트웨어 엔지니어 Susam Pal이 올해 초 발표한 글 “Three Inverse Laws of AI”는 이 발상에서 출발한다. 그가 제안하는 세 가지 역법칙은 AI 시스템이 어떻게 행동해야 하는지가 아니라, 인간이 AI를 … 더 읽기

Gemma4의 추론 속도를 세 배 높이는 방법

Gemma4의 추론 속도를 세 배 높이는 방법

언어모델이 텍스트를 생성하는 방식은 본질적으로 순차적이다. 토큰 하나를 만들고, 그것을 바탕으로 다음 토큰을 만들고, 또 그것을 바탕으로 또 다음 토큰을 만든다. 모델이 아무리 크고 하드웨어가 아무리 좋아도, 이 구조 자체가 지연을 만들어낸다. 구글이 5월 5일 공개한 Gemma 4의 멀티-토큰 예측(MTP) 드래프터는 바로 이 병목을 정면으로 겨냥한다. 아이디어는 추측 디코딩(Speculative Decoding)에서 출발한다. 크고 정확한 타겟 모델이 … 더 읽기

Replacing Claude Haiku with Ollama gemma4:e4b — Web Search and File Exploration via Local LLM

Replacing Claude Haiku with Ollama gemma4:e4b — Web Search and File Exploration via Local LLM

At some point when you’re using the Claude Haiku API to filter web search results or narrow down relevant files in a codebase, a question creeps in: “Does this really need to go to a cloud API?” There’s also the nagging feeling that internal code or potentially sensitive file contents are passing through an external … 더 읽기