AI 에이전트에게 시니어 엔지니어의 판단을 심는 법 — Agent Skills

AI 에이전트에게 시니어 엔지니어의 판단을 심는 법 — Agent Skills

AI 에이전트가 코드를 짜고 PR을 올리는 시대에, 에이전트가 “잘 작동한다”는 것의 기준은 무엇일까. Google Chrome팀의 Addy Osmani가 최근 이 질문에 정면으로 답하는 글을 내놨다. 이미지 출처: Unsplash 그가 말하는 “스킬(Skill)”은 단순한 문서가 아니다. 프론트매터(frontmatter)가 달린 마크다운 파일로, 특정 상황이 감지될 때 에이전트의 컨텍스트에 자동으로 주입되는 구조화된 워크플로우다. 차이는 미묘하지만 중요하다. “테스트를 잘 작성해야 한다”고 설명하는 … 더 읽기

실시간 음성 AI를 900만 명 규모로 — OpenAI의 저지연 인프라 설계

ChatGPT에서 실시간 음성 대화를 해본 적이 있다면, 그 응답 속도가 얼마나 많은 공학적 고민의 결과인지 체감하기 쉽지 않다. OpenAI가 이번 주 저지연 음성 AI를 대규모로 운영하는 방법을 상세히 공개했다. 이미지 출처: Unsplash 핵심 결정은 전통적인 SFU(Selective Forwarding Unit) 방식을 버리고 WebRTC 직접 트랜시버 연결을 택한 것이다. 기존 음성·영상 통화 인프라는 대부분 중간 서버가 미디어 스트림을 … 더 읽기

Multi-Model Orchestration: Running Claude, Gemini, and Codex CLI Together

Multi-Model Orchestration: Running Claude, Gemini, and Codex CLI Together

If you’re a developer these days, there’s a good chance you’re using at least one AI CLI daily. Command-line tools that let you call AI models directly from the terminal have become the new productivity standard — moving well beyond browser-based chat interfaces. But spend enough time with any single tool and one thing becomes … 더 읽기

AI 에이전트에 코딩을 맡기면 어떻게 되나 — “함정”이라는 주장

AI 코딩 에이전트가 코드를 짜주는 동안, 개발자는 어떤 능력을 잃어가고 있을까. Lars Faye는 최근 글에서 “에이전트 코딩은 함정”이라는 단호한 주장을 내놨다. 이미지 출처: Unsplash 핵심 논지는 ‘인지능력 약화(Cognitive Atrophy)’다. AI 에이전트에 코딩을 전적으로 위임하면 수개월 안에 디버깅 능력이 눈에 띄게 떨어지고, 코드가 동작하는 방식에 대한 명확한 정신 모델이 사라진다는 것이다. 그리고 여기서 역설이 생긴다. AI를 … 더 읽기

AI가 ER 의사보다 진단을 잘한다? — 하버드 연구의 67%를 둘러싼 논쟁

AI가 응급실 의사보다 진단 정확도가 높다는 하버드 연구가 나왔다. 수치만 보면 충격적이다. 그런데 연구 방법을 조금만 들여다보면 이야기가 꽤 달라진다. 이미지 출처: Unsplash 연구팀은 OpenAI의 o1 모델이 응급실 환자 케이스를 올바르게 진단한 비율이 67%로, 분류 담당 의사(triage doctor)의 50~55%보다 유의미하게 높았다고 발표했다. 수치만 떼어 놓으면 AI가 의사를 앞섰다는 인상을 주기에 충분하고, 실제로 많은 매체가 그렇게 … 더 읽기

트랜스포머의 틀을 넘어 — Liquid AI의 LFM2-24B-A2B 공개

AI 언어 모델 경쟁에서 아키텍처 이야기가 다시 수면 위로 떠오르고 있다. 대형 모델 대부분이 트랜스포머(Transformer) 구조를 당연하게 채택하는 동안, Liquid AI는 처음부터 다른 길을 골랐다. 이미지 출처: Unsplash MIT 연구진이 2023년 창업한 이 보스턴 스타트업은 이번 주 LFM2-24B-A2B를 오픈 웨이트(Open Weights)로 공개했다. 이름을 풀면, LFM은 Liquid Foundation Model의 약자이고 24B-A2B는 전체 파라미터 240억 개 중 … 더 읽기

Claude·Gemini·Codex CLI를 묶어 쓰는 멀티 모델 오케스트레이션 셋업 가이드

Multi-Model Orchestration: Running Claude, Gemini, and Codex CLI Together

요즘 개발자라면 AI CLI 한두 개쯤은 매일 쓰고 있을 것이다. ChatGPT나 Claude 웹 인터페이스를 넘어 터미널에서 직접 호출 가능한 명령줄 도구들이 생산성의 새로운 표준으로 자리잡았다. 그런데 한참 쓰다 보면 한 가지가 분명해진다. 어떤 모델 하나만 골라 쓰면 결국 어딘가에서 한계에 부딪힌다. 이미지 출처: Unsplash 이 글에서는 Claude Code, Gemini CLI, Codex CLI를 묶어서 멀티 모델 … 더 읽기

구글은 왜 Anthropic에 400억 달러를 더 베팅하나

자체 모델을 키우는 회사가 잠재적 경쟁자에 또 거액을 넣는다. 구글이 Claude를 만드는 Anthropic에 최대 400억 달러, 우리 돈으로 약 55조 원에 달하는 추가 투자를 협의 중이라는 소식이 전해졌다. 이미지 출처: Unsplash 구글은 이미 2023년에 5억 달러, 2024년에 20억 달러를 투자한 바 있다. 이번 라운드까지 마무리되면 누적 투자액은 단숨에 500억 달러를 넘긴다. AI 단일 기업에 들어간 … 더 읽기