Claude Haiku 대신 Ollama gemma4:e4b — 웹서치와 파일 탐색을 로컬 LLM으로

Claude Haiku 대신 Ollama gemma4:e4b — 웹서치와 파일 탐색을 로컬 LLM으로

웹 검색 결과를 정리하거나, 코드베이스에서 관련 파일을 추려내는 작업에 클로드 하이쿠 API를 쓰다 보면 어느 순간 “이 정도 작업을 꼭 클라우드 API로 보내야 하나?”라는 의문이 든다. 민감할 수 있는 파일 내용이나 내부 코드가 외부 서버를 거친다는 점도 마음에 걸린다. 이미지 출처: Unsplash 마침 올라마(Ollama)에서 gemma4:e4b를 로컬에서 돌려본 뒤로 생각이 달라졌다. 반복성 높은 경량 작업에서는 하이쿠와 … 더 읽기

Bun이 걱정된다 — Anthropic 인수 이후를 바라보는 시선

Bun이 걱정된다 — Anthropic 인수 이후를 바라보는 시선

Bun은 Node.js 생태계에서 가장 빠르게 주목받은 JavaScript 런타임 중 하나다. 설치 속도, 번들링, 테스트 러너까지 하나로 묶은 구성이 개발자들 사이에서 빠르게 입소문을 탔다. 그런데 최근 한 개발자가 조용한 우려를 꺼냈다. 제목은 단순하다. “Bun이 걱정된다.” 이미지 출처: Unsplash 글의 핵심은 Anthropic의 인수 이후 Bun의 방향이 어떻게 달라질지에 대한 불안이다. 저자는 그 우려의 근거로 Claude Code의 변화를 … 더 읽기

AI 에이전트에게 시니어 엔지니어의 판단을 심는 법 — Agent Skills

AI 에이전트에게 시니어 엔지니어의 판단을 심는 법 — Agent Skills

AI 에이전트가 코드를 짜고 PR을 올리는 시대에, 에이전트가 “잘 작동한다”는 것의 기준은 무엇일까. Google Chrome팀의 Addy Osmani가 최근 이 질문에 정면으로 답하는 글을 내놨다. 이미지 출처: Unsplash 그가 말하는 “스킬(Skill)”은 단순한 문서가 아니다. 프론트매터(frontmatter)가 달린 마크다운 파일로, 특정 상황이 감지될 때 에이전트의 컨텍스트에 자동으로 주입되는 구조화된 워크플로우다. 차이는 미묘하지만 중요하다. “테스트를 잘 작성해야 한다”고 설명하는 … 더 읽기

실시간 음성 AI를 900만 명 규모로 — OpenAI의 저지연 인프라 설계

ChatGPT에서 실시간 음성 대화를 해본 적이 있다면, 그 응답 속도가 얼마나 많은 공학적 고민의 결과인지 체감하기 쉽지 않다. OpenAI가 이번 주 저지연 음성 AI를 대규모로 운영하는 방법을 상세히 공개했다. 이미지 출처: Unsplash 핵심 결정은 전통적인 SFU(Selective Forwarding Unit) 방식을 버리고 WebRTC 직접 트랜시버 연결을 택한 것이다. 기존 음성·영상 통화 인프라는 대부분 중간 서버가 미디어 스트림을 … 더 읽기

Multi-Model Orchestration: Running Claude, Gemini, and Codex CLI Together

Multi-Model Orchestration: Running Claude, Gemini, and Codex CLI Together

If you’re a developer these days, there’s a good chance you’re using at least one AI CLI daily. Command-line tools that let you call AI models directly from the terminal have become the new productivity standard — moving well beyond browser-based chat interfaces. But spend enough time with any single tool and one thing becomes … 더 읽기

AI 에이전트에 코딩을 맡기면 어떻게 되나 — “함정”이라는 주장

AI 코딩 에이전트가 코드를 짜주는 동안, 개발자는 어떤 능력을 잃어가고 있을까. Lars Faye는 최근 글에서 “에이전트 코딩은 함정”이라는 단호한 주장을 내놨다. 이미지 출처: Unsplash 핵심 논지는 ‘인지능력 약화(Cognitive Atrophy)’다. AI 에이전트에 코딩을 전적으로 위임하면 수개월 안에 디버깅 능력이 눈에 띄게 떨어지고, 코드가 동작하는 방식에 대한 명확한 정신 모델이 사라진다는 것이다. 그리고 여기서 역설이 생긴다. AI를 … 더 읽기

AI가 ER 의사보다 진단을 잘한다? — 하버드 연구의 67%를 둘러싼 논쟁

AI가 응급실 의사보다 진단 정확도가 높다는 하버드 연구가 나왔다. 수치만 보면 충격적이다. 그런데 연구 방법을 조금만 들여다보면 이야기가 꽤 달라진다. 이미지 출처: Unsplash 연구팀은 OpenAI의 o1 모델이 응급실 환자 케이스를 올바르게 진단한 비율이 67%로, 분류 담당 의사(triage doctor)의 50~55%보다 유의미하게 높았다고 발표했다. 수치만 떼어 놓으면 AI가 의사를 앞섰다는 인상을 주기에 충분하고, 실제로 많은 매체가 그렇게 … 더 읽기

C를 버리지 않고 더 안전하게 — Microsoft의 lib0xc 오픈소스 공개

“안전한 소프트웨어를 만들고 싶다면 C를 버리고 Rust로 가라.” 최근 몇 년 사이 미국 NSA, 백악관 사이버 보안 전략 보고서까지 이런 방향을 공식 권고하고 있다. Microsoft 역시 내부 신규 프로젝트에서 Rust 채택을 적극 장려해온 곳이다. 그런데 이번에 내놓은 패는 예상과 달랐다. 이미지 출처: Unsplash Microsoft는 이번 주 lib0xc를 GitHub에 오픈소스로 공개했다. “C 표준 라이브러리 인접 API들을 … 더 읽기

트랜스포머의 틀을 넘어 — Liquid AI의 LFM2-24B-A2B 공개

AI 언어 모델 경쟁에서 아키텍처 이야기가 다시 수면 위로 떠오르고 있다. 대형 모델 대부분이 트랜스포머(Transformer) 구조를 당연하게 채택하는 동안, Liquid AI는 처음부터 다른 길을 골랐다. 이미지 출처: Unsplash MIT 연구진이 2023년 창업한 이 보스턴 스타트업은 이번 주 LFM2-24B-A2B를 오픈 웨이트(Open Weights)로 공개했다. 이름을 풀면, LFM은 Liquid Foundation Model의 약자이고 24B-A2B는 전체 파라미터 240억 개 중 … 더 읽기

Claude·Gemini·Codex CLI를 묶어 쓰는 멀티 모델 오케스트레이션 셋업 가이드

Multi-Model Orchestration: Running Claude, Gemini, and Codex CLI Together

요즘 개발자라면 AI CLI 한두 개쯤은 매일 쓰고 있을 것이다. ChatGPT나 Claude 웹 인터페이스를 넘어 터미널에서 직접 호출 가능한 명령줄 도구들이 생산성의 새로운 표준으로 자리잡았다. 그런데 한참 쓰다 보면 한 가지가 분명해진다. 어떤 모델 하나만 골라 쓰면 결국 어딘가에서 한계에 부딪힌다. 이미지 출처: Unsplash 이 글에서는 Claude Code, Gemini CLI, Codex CLI를 묶어서 멀티 모델 … 더 읽기