LM Studio는 무료 앱입니다. AI 모델을 내 컴퓨터에 다운로드해서 완전히 로컬에서 실행하게 해주는 도구입니다. ChatGPT와 비슷한 채팅 화면을 제공하기 때문에, 사용법은 거의 동일합니다. 개인 정보가 외부로 나가지 않고, 구독료도 없으며, 한번 모델을 받아두면 인터넷 없이도 평생 쓸 수 있습니다.
시작 전에 — 내 컴퓨터가 되는지 확인하기
LM Studio는 어지간한 노트북에서 다 돌아갑니다. 고사양 컴퓨터일수록 더 좋은 모델을 더 빠르게 쓸 수 있고, 저사양이라면 작은 모델을 쓰면 됩니다. 아래 표에서 내 환경을 확인하세요.
| 환경 | 최소 RAM | 추천 RAM | 사용 가능한 모델 크기 |
|---|---|---|---|
| Mac (Apple Silicon M1~M4) | 8GB | 16GB+ | 3B ~ 27B |
| Windows (NVIDIA GPU 6GB+) | 8GB RAM | 16GB RAM | 7B ~ 13B |
| Windows (GPU 없음 / 내장그래픽) | 8GB | 16GB+ | 3B ~ 4B (느림) |
| Linux | 8GB | 16GB+ | 3B ~ 27B |
Step 1 — LM Studio 다운로드 및 설치
브라우저에서
lmstudio.ai에 접속합니다. 메인 화면에서 본인의 운영체제(macOS / Windows / Linux)에 맞는 다운로드 버튼을 클릭합니다.
macOS는
.dmg 파일을 열고 앱을 Applications 폴더로 드래그합니다. Windows는 .exe 설치 파일을 실행하고 안내에 따라 설치합니다. 별도 설정 없이 기본값으로 진행해도 됩니다.
설치 후 앱을 열면 환영 화면이 뜹니다. 왼쪽 사이드바에 아이콘들이 있고, 기본적으로 Discover(돋보기 아이콘) 탭이 선택됩니다. 여기서 모델을 검색하고 다운로드합니다.
Step 2 — 어떤 모델을 받을까? 초보자 추천 모델 5선
모델은 AI의 “두뇌” 역할을 합니다. 크기가 클수록 똑똑하지만 더 많은 RAM을 쓰고 응답이 느립니다. 처음이라면 내 RAM의 절반 이하를 쓰는 모델부터 시작하는 것을 추천합니다.
추천 모델 RAM 사용량 비교
실행 중 필요한 대략적인 RAM 용량 (모델 양자화 수준에 따라 다를 수 있음)
Step 3 — 모델 다운로드하기
이 단계가 가장 중요합니다. 비행기 탑승 전에 반드시 완료해야 하고, 와이파이 없이는 불가능하기 때문입니다. 하나씩 따라오세요.
LM Studio 왼쪽 사이드바에서 돋보기 모양 아이콘을 클릭하면 Discover 탭이 열립니다. 화면 상단에 검색창이 있고, 아래에는 인기 모델들이 카드 형태로 나열됩니다. 인터넷이 연결된 상태에서만 이 탭이 정상 작동합니다.
추천 모델 중 받고 싶은 것을 검색합니다. 아래 검색어를 그대로 복사해서 입력하면 됩니다.
qwen2.5 7b instructgemma 4 e4bphi-4-mini instruct검색 결과로 같은 모델의 여러 버전이 나옵니다. 업로더(제작자) 이름이 다를 수 있는데, bartowski 또는 lmstudio-community가 붙은 것을 선택하면 LM Studio 최적화 버전입니다.
모델 이름 뒤에 붙는
Q4_K_M, Q8_0 같은 코드가 “양자화 수준”입니다. 숫자가 낮을수록 파일이 작고 빠르지만 품질이 조금 떨어지고, 높을수록 원본에 가깝지만 파일이 큽니다.
| 버전 이름 | 파일 크기 (7B 기준) | 품질 | 추천 상황 |
|---|---|---|---|
Q2_K |
약 2.7GB | 낮음 | RAM 8GB 극한 절약 시 |
Q4_K_M |
약 4.4GB | 우수 | 처음이라면 무조건 이것 |
Q5_K_M |
약 5.1GB | 매우 우수 | RAM 16GB 이상 여유 있을 때 |
Q8_0 |
약 7.7GB | 원본 수준 | RAM 32GB+ 고사양 환경 |
Q4_K_M을 선택하세요. 파일 크기와 품질의 균형이 가장 좋습니다.
원하는 버전 오른쪽의 Download 버튼을 클릭합니다. 버튼이 진행 바로 바뀌면서 다운로드가 시작됩니다. 파일 크기와 인터넷 속도에 따라 시간이 다릅니다.
Q4_K_M 7B 모델(약 4.4GB) 기준 대략적인 소요 시간
진행 바가 사라지고 “Downloaded” 또는 체크 표시로 바뀌면 완료입니다. 왼쪽 사이드바에서 하드디스크 모양 아이콘(My Models)을 클릭하면 저장된 모델 목록을 확인할 수 있습니다. 목록에 방금 받은 모델이 표시되면 성공입니다.
모델은 기본적으로 아래 경로에 저장됩니다. 저장 공간이 부족하다면 LM Studio 설정(Settings)에서 경로를 외장 드라이브로 변경할 수 있습니다.
~/.lmstudio/models/C:\Users\사용자명\.lmstudio\models\자주 묻는 질문
qwen2.5만 입력해도 관련 모델이 뜹니다.Step 4 — ChatGPT처럼 채팅 시작하기
왼쪽 사이드바에서 말풍선 모양 아이콘(Chat)을 클릭합니다.
화면 상단 드롭다운에서 방금 다운로드한 모델을 선택합니다. 처음 로드할 때 수십 초 정도 걸립니다. 로딩이 끝나면 채팅창 아래 입력란이 활성화됩니다.
입력창에 질문을 입력하고 Enter를 누릅니다. ChatGPT와 똑같은 방식입니다. 이제 인터넷 없이도 AI와 대화할 수 있습니다.
시스템 프롬프트 설정으로 ChatGPT처럼 만들기
Chat 탭 상단의 System Prompt 영역에 아래 내용을 붙여넣으면, 모델이 더 자연스러운 한국어로 응답합니다.
당신은 친절하고 유능한 AI 어시스턴트입니다. 사용자의 질문에 항상 한국어로 답변합니다. 답변은 명확하고 간결하게 작성합니다. 모르는 내용은 모른다고 솔직하게 말합니다.
비행기 모드에서 제대로 되는지 미리 테스트하기
탑승 전에 반드시 오프라인 동작을 확인하는 것을 권장합니다. 방법은 간단합니다.
모델이 로컬 파일로 저장되어 있기 때문에, 인터넷이 없어도 완전히 동작합니다. 응답 속도는 인터넷 상태와 무관하게 내 컴퓨터 성능에만 달려 있습니다.
솔직하게 — ChatGPT와 비교했을 때 다른 점
ChatGPT vs 로컬 LLM (LM Studio) 비교
* 5점 만점 주관 평가 기준
솔직히 말해서, 로컬 LLM의 답변 품질은 ChatGPT GPT-4o보다 낮습니다. 특히 복잡한 추론이나 최신 뉴스 관련 질문에서 차이가 납니다. 7B 모델은 ChatGPT GPT-3.5 수준 정도로 보면 됩니다. 하지만 문서 요약, 번역, 간단한 코드 작성, 아이디어 정리 같은 일상 작업에서는 충분히 쓸 만합니다.
응답 속도도 컴퓨터 성능에 따라 다릅니다. M2 MacBook Air 16GB 기준으로 Qwen2.5 7B는 초당 30~50 토큰 정도로, 읽는 속도와 비슷하게 텍스트가 나옵니다. Intel CPU만 있는 Windows 노트북에서는 이보다 훨씬 느릴 수 있습니다.
무엇보다 오프라인, 개인정보 보호, 무료라는 장점은 명확합니다. 회사 내부 문서나 민감한 정보를 AI에 붙여넣기 꺼림칙했던 분들께 특히 유용합니다. 비행기 안에서 보고서를 다듬거나, 영어 메일을 번역하거나, 코드 리뷰를 받는 용도라면 로컬 LLM이 완전히 실용적인 선택입니다.
한 줄 정리 — 비행기 탑승 전 할 일
처음 설정하는 데 30분, 모델 다운로드에 10~20분이면 끝납니다. 한번 세팅해두면 그 이후로는 앱을 열고 모델을 로드하는 것만으로 바로 쓸 수 있습니다. 구독료, 인터넷, 개인정보 걱정 없이 어디서든 쓸 수 있는 나만의 AI가 생기는 셈입니다.