Zed + LM Studio + Gemma4 E4B — 로컬 AI 코딩 환경

Zed + LM Studio + Gemma4 E4B — 로컬 AI 코딩 환경

VS Code를 꽤 오래 썼다. 익숙하고, 확장 생태계도 방대하고, 모르는 사람이 없다는 것 자체가 일종의 안전망이었다. 그런데 어느 순간부터 에디터를 켤 때마다 느끼는 묵직함이 쌓이기 시작했다. 탭이 많아질수록 버벅거리고, 설치된 익스텐션들이 서로 충돌하고, 설정 파일은 어느새 수백 줄이 넘어 있었다. 코드를 쓰는 도구인데, 도구를 관리하는 데 시간을 쓰고 있다는 느낌이었다. VS Code에서 Zed로 갈아탄 이유 … 더 읽기

AI가 코드를 빠르게 써줄수록 유지보수는 더 느려진다

AI가 코드를 빠르게 써줄수록 유지보수는 더 느려진다

AI 코딩 에이전트 도입에 관한 논의는 대부분 “얼마나 빠르게 코드를 작성할 수 있는가”를 중심으로 돌아간다. 2배, 5배, 심지어 10배라는 숫자들이 마케팅 문구에 등장하고, 개발팀들은 그 숫자를 근거로 도입을 검토한다. 그런데 애자일(Agile) 소프트웨어 개발의 실천가이자 컨설턴트인 James Shore는 이 질문 자체가 잘못 설정되어 있다고 지적한다. Shore의 글 “You Need AI That Reduces Your Maintenance Costs”는 소프트웨어 … 더 읽기

필즈상 수상자가 ChatGPT 5.5 Pro에게 수학 연구를 맡겨봤더니

필즈상 수상자가 ChatGPT 5.5 Pro에게 수학 연구를 맡겨봤더니

지난 며칠 사이 수학계에서 꽤 조용하지 않은 글 하나가 퍼졌다. 영국 케임브리지 대학교의 수학자이자 필즈상(수학계의 노벨상이라 불리는 최고 권위의 상) 수상자인 Timothy Gowers가 자신의 블로그에 ChatGPT 5.5 Pro와 함께 진행한 수학 연구 실험을 상세히 기록했다. 그 결과는, 솔직히 말하면, 꽤 불편한 느낌을 주는 수준이었다. Gowers가 AI에게 던진 문제는 아무 문제나가 아니었다. 이스라엘 수학자 Mel Nathanson이 … 더 읽기

AI 에이전트에 필요한 건 더 좋은 프롬프트가 아니다

AI 에이전트에 필요한 건 더 좋은 프롬프트가 아니다

AI 에이전트가 말을 안 들을 때 개발자들이 가장 먼저 하는 일은 프롬프트를 고치는 것이다. 지시를 더 명확하게, 더 강하게, 더 길게. “반드시 이 단계를 건너뛰지 마세요”라는 문구가 프롬프트 곳곳에 박힌다. 그런데 어느 순간 그것도 소용이 없어진다. 소프트웨어 엔지니어 Brandon Suh가 최근 올린 글 “Agents need control flow, not more prompts”는 이 막힌 천장을 정면으로 다룬다. … 더 읽기

코드를 읽지 않고 배포한다는 것

코드를 읽지 않고 배포한다는 것

“Claude Code에게 JSON API 엔드포인트를 작성해달라고 하면, 올바르게 작성된다는 걸 안다. 그래서 더 이상 모든 코드를 검토하지 않는다.” 이 문장을 Django 공동 창시자이자 개발자 커뮤니티의 대표적인 목소리인 Simon Willison이 썼다. Willison이 최근 자신의 블로그에 올린 글 제목은 “Vibe coding and agentic engineering are getting closer than I’d like”다. 직역하면 “바이브 코딩과 에이전트 엔지니어링이 내가 원하는 … 더 읽기

AI를 위한 역(逆) 법칙 세 가지

AI를 위한 역(逆) 법칙 세 가지

아이작 아시모프의 로봇 3법칙은 로봇이 지켜야 할 규칙이다. 그런데 AI가 일상 깊숙이 들어온 지금, 정작 규제가 필요한 건 AI가 아니라 AI를 쓰는 인간의 행동 방식일지도 모른다. 소프트웨어 엔지니어 Susam Pal이 올해 초 발표한 글 “Three Inverse Laws of AI”는 이 발상에서 출발한다. 그가 제안하는 세 가지 역법칙은 AI 시스템이 어떻게 행동해야 하는지가 아니라, 인간이 AI를 … 더 읽기

Gemma4의 추론 속도를 세 배 높이는 방법

Gemma4의 추론 속도를 세 배 높이는 방법

언어모델이 텍스트를 생성하는 방식은 본질적으로 순차적이다. 토큰 하나를 만들고, 그것을 바탕으로 다음 토큰을 만들고, 또 그것을 바탕으로 또 다음 토큰을 만든다. 모델이 아무리 크고 하드웨어가 아무리 좋아도, 이 구조 자체가 지연을 만들어낸다. 구글이 5월 5일 공개한 Gemma 4의 멀티-토큰 예측(MTP) 드래프터는 바로 이 병목을 정면으로 겨냥한다. 아이디어는 추측 디코딩(Speculative Decoding)에서 출발한다. 크고 정확한 타겟 모델이 … 더 읽기

Replacing Claude Haiku with Ollama gemma4:e4b — Web Search and File Exploration via Local LLM

Replacing Claude Haiku with Ollama gemma4:e4b — Web Search and File Exploration via Local LLM

At some point when you’re using the Claude Haiku API to filter web search results or narrow down relevant files in a codebase, a question creeps in: “Does this really need to go to a cloud API?” There’s also the nagging feeling that internal code or potentially sensitive file contents are passing through an external … 더 읽기

Claude Haiku 대신 Ollama gemma4:e4b — 웹서치와 파일 탐색을 로컬 LLM으로

AI가 코드를 빠르게 써줄수록 유지보수는 더 느려진다

웹 검색 결과를 정리하거나, 코드베이스에서 관련 파일을 추려내는 작업에 클로드 하이쿠 API를 쓰다 보면 어느 순간 “이 정도 작업을 꼭 클라우드 API로 보내야 하나?”라는 의문이 든다. 민감할 수 있는 파일 내용이나 내부 코드가 외부 서버를 거친다는 점도 마음에 걸린다. 이미지 출처: Unsplash 마침 올라마(Ollama)에서 gemma4:e4b를 로컬에서 돌려본 뒤로 생각이 달라졌다. 반복성 높은 경량 작업에서는 하이쿠와 … 더 읽기

Bun이 걱정된다 — Anthropic 인수 이후를 바라보는 시선

Bun이 걱정된다 — Anthropic 인수 이후를 바라보는 시선

Bun은 Node.js 생태계에서 가장 빠르게 주목받은 JavaScript 런타임 중 하나다. 설치 속도, 번들링, 테스트 러너까지 하나로 묶은 구성이 개발자들 사이에서 빠르게 입소문을 탔다. 그런데 최근 한 개발자가 조용한 우려를 꺼냈다. 제목은 단순하다. “Bun이 걱정된다.” 이미지 출처: Unsplash 글의 핵심은 Anthropic의 인수 이후 Bun의 방향이 어떻게 달라질지에 대한 불안이다. 저자는 그 우려의 근거로 Claude Code의 변화를 … 더 읽기