본문 바로가기

Ai 취미생활

VS Code에서 Gemma 4 로컬 AI 쓰는 방법 - GitHub Copilot 없이

[VS Code에서 로컬 AI 모델을 활용하는 개발 환경 대표 이미지]
📌 이 글에서 다루는 것
  • GitHub Copilot 없이도 VS Code에서 AI 코딩 보조를 쓰는 방법
  • Continue 확장 프로그램으로 Gemma 4 로컬 모델 연결하기 (채팅 + 자동완성)
  • GitHub Copilot이 있다면 Ollama로 Gemma 4 바로 연결하는 더 간단한 방법

GitHub Copilot, 써보고 싶긴 한데 한 달에 10달러씩 내기가 좀 아깝잖아요.

그래서 찾다 보니까 — 어? 맥미니에 Gemma 4 이미 깔려 있잖아. 이걸 VS Code랑 연결하면 되는 거 아닌가? 라는 생각이 들었습니다.

결론부터 말하면 됩니다. 그것도 생각보다 설정이 간단해서 좀 놀랐어요. 오늘은 제가 직접 해본 방법 두 가지를 정리해볼게요. 하나는 GitHub Copilot 없이도 되는 방법, 하나는 Copilot이 있을 때 더 간편하게 쓰는 방법입니다.

🔑 핵심 개념 한 줄 정리

Ollama가 Gemma 4를 로컬에서 서버처럼 실행해주면, VS Code 확장 프로그램이 거기다 연결해서 AI 기능을 쓰는 구조입니다. 클라우드 없이, 돈 없이.

🗺️ 내 상황에 맞는 방법 고르기

두 방법 중에 뭘 선택해야 할지 먼저 정하고 시작하는 게 편합니다.

방법 A — Continue 확장 방법 B — Copilot + Ollama
비용 완전 무료 GitHub Copilot 구독 필요
설정 난이도 약간 있음 (config 파일 수정) 매우 간단 (UI에서 클릭)
자동완성 ✅ 가능 채팅 위주
추천 대상 Copilot 없는 분 Copilot 이미 쓰는 분

Copilot 없으시면 방법 A부터 따라 하시면 되고요, Copilot 구독 중이시면 방법 B가 훨씬 빠릅니다. 이 글은 방법 A를 중심으로 상세히 다루고, 방법 B는 뒤에서 간략히 다룰게요.

📋 먼저 이것부터 — Ollama랑 Gemma 4 실행 확인

VS Code 설정 들어가기 전에, Ollama가 켜져 있고 Gemma 4가 다운돼 있어야 합니다. 터미널 열고 아래 두 줄만 확인해보세요.

# 1. Gemma 4 있는지 확인
ollama list

# 2. Ollama 서버 시작 (새 터미널 탭에서)
ollama serve

ollama list에 gemma4가 보이고, ollama serve 실행하면 "Listening on 127.0.0.1:11434" 뜨면 준비 완료입니다.

Gemma 4가 아직 없다면 아래 명령어로 받으시면 돼요. 맥미니 M4 16GB는 E4B 권장합니다.

# 맥미니 M4 16GB 기준 추천
ollama pull gemma4:e4b

🅐 방법 A — Continue 확장으로 무료 AI 코딩 도우미 만들기

Continue는 오픈소스로 개발된 VS Code 확장 프로그램인데요, 쉽게 말해 Copilot처럼 채팅하고 코드 자동완성도 되는데 — 내가 지정한 어떤 AI 모델이든 붙일 수 있습니다. 로컬 Gemma 4는 물론이고, Claude나 GPT API를 연결할 수도 있어요.

A-STEP 1. Continue 확장 프로그램 설치

VS Code에서 확장 탭을 엽니다. 왼쪽 사이드바에서 블록 4개 모양 아이콘 클릭하거나 ⌘ + Shift + X 누르면 됩니다.

검색창에 Continue라고 치면 "Continue - Codestral, Claude, and more" 라는 확장이 바로 나옵니다. 만든 곳이 Continue.dev라고 적혀 있는 걸 설치하시면 됩니다. Install 누르고 잠깐 기다리면 끝.

설치되면 왼쪽 사이드바에 Continue 아이콘이 생깁니다. 클릭하면 채팅 패널이 오른쪽에 열리는데, 처음엔 계정 로그인하라고 나올 수 있어요. 계정 없이 로컬만 쓸 거라면 "Use local model" 또는 "Skip"을 선택하면 됩니다.

A-STEP 2. config 파일에 Gemma 4 연결하기

이 단계가 핵심입니다. 설정 파일 하나를 수정해야 하는데, 어렵진 않아요. 파일 찾는 방법부터 알려드릴게요.

설정 파일 여는 법 (두 가지 중 편한 거 선택)

  • Continue 채팅 패널 하단 왼쪽 ⚙️ (설정) 아이콘 클릭 → config.json 열기
  • 또는 ⌘ + Shift + PContinue: Open Config 입력 후 Enter

파일이 열리면 내용을 전부 지우고 아래 내용으로 교체합니다. 복붙하시면 됩니다.

{
  "models": [
    {
      "title": "Gemma 4 (로컬)",
      "provider": "ollama",
      "model": "gemma4:e4b",
      "apiBase": "http://localhost:11434"
    }
  ],
  "tabAutocompleteModel": {
    "title": "Gemma 4 자동완성",
    "provider": "ollama",
    "model": "gemma4:e4b",
    "apiBase": "http://localhost:11434"
  },
  "tabAutocompleteOptions": {
    "debounceDelay": 500
  },
  "allowAnonymousTelemetry": false
}
📝 잠깐 — 모델명 확인하세요: 위 설정에서 "gemma4:e4b" 부분이 실제로 내 컴퓨터에 설치된 모델명과 일치해야 합니다. ollama list로 나온 이름이랑 대소문자까지 똑같이 써주세요.

저장하고 VS Code를 한 번 껐다 켜면 Continue가 Gemma 4랑 연결됩니다. Continue 채팅 패널 상단에 "Gemma 4 (로컬)" 이렇게 보이면 성공입니다.

A-STEP 3. 실제로 이렇게 씁니다 — 단축키와 활용법

설치가 끝났으면 실제로 어떻게 쓰는지 알아야겠죠. 주로 세 가지 상황에서 씁니다.

① 코드 쓰다가 질문하고 싶을 때 — ⌘ + L

코드 아무 데서나 이 단축키를 누르면 오른쪽에 채팅 패널이 열립니다. 여기다 그냥 물어보면 돼요. "이 함수가 왜 느린 거야?" 라든지 "여기 에러 이유 알려줘" 라든지. 현재 열려 있는 파일 내용을 AI가 이미 알고 있어서 따로 붙여넣을 필요가 없습니다.

② 특정 코드 블록을 고쳐달라고 할 때 — 드래그 선택 후 ⌘ + L

고치고 싶은 코드를 마우스로 드래그해서 선택한 다음 ⌘ + L을 누르면, 그 코드가 채팅창에 자동으로 올라갑니다. 거기다 "이거 리팩터링해줘" 또는 "한국어 주석 추가해줘" 라고 치면 됩니다. 제안이 오면 Accept / Reject 버튼으로 적용하거나 거절할 수 있어요.

③ 코드 자동완성 — 그냥 타이핑하면 됩니다

설정이 잘 됐다면 코드를 타이핑하다 보면 반투명한 회색 글씨로 다음 줄을 제안해줍니다. GitHub Copilot이랑 똑같은 방식이에요. Tab을 누르면 수락, 그냥 계속 타이핑하면 무시됩니다. 자동완성이 안 보인다면 Ctrl + Alt + Space로 강제로 불러올 수 있습니다.

단축키 기능
⌘ + L 채팅 패널 열기 / 선택 코드 채팅으로 보내기
Tab 자동완성 제안 수락
Ctrl+Alt+Space 자동완성 강제 트리거
⌘ + Shift + L 현재 파일 전체를 채팅 컨텍스트로 추가

🅑 방법 B — GitHub Copilot이 있다면 이게 더 편합니다

GitHub Copilot 구독 중이신 분들은 Continue 설치할 필요도 없습니다. VS Code 1.95 이후로 Copilot에서 Ollama 로컬 모델을 바로 선택할 수 있게 됐거든요.

  1. VS Code 오른쪽 하단 Copilot 아이콘 클릭 → Copilot Chat 열기
  2. 채팅 패널 하단 모델 드롭다운 클릭 → "Manage Models" 선택
  3. 공급자 목록에서 "Ollama" 선택
  4. 로컬에 설치된 모델 목록이 뜹니다 → gemma4:e4b 체크
  5. 이제 Copilot Chat에서 모델을 Gemma 4로 전환해서 사용 가능
💡 이 방법의 한 가지 제한: Copilot Chat에서 채팅은 되는데, 인라인 코드 자동완성(타이핑하다가 회색으로 뜨는 것)은 아직 클라우드 모델만 지원합니다. 자동완성까지 로컬로 쓰고 싶다면 방법 A(Continue)를 써야 합니다.

🛠️ 이거 가끔 안 돼요 — 흔한 문제들

설정 다 했는데 안 될 때 대부분 이 중 하나입니다.

❶ "Connection refused" 또는 모델이 응답 없음
Ollama 서버가 꺼진 겁니다. 터미널에서 ollama serve 다시 실행하세요. 맥미니 재시작했다면 Ollama도 다시 켜줘야 합니다. 번거롭다면 brew services start ollama로 자동 시작 설정해두는 게 편합니다.
❷ 자동완성 제안이 아예 안 보임
VS Code 설정에서 editor.inlineSuggest.enabled가 true인지 확인해보세요. ⌘ + , → 검색창에 "inlineSuggest" 입력 → 체크박스 켜져 있는지 확인.
❸ 응답이 너무 느림
터미널에서 ollama ps 실행해보세요. PROCESSOR 칸이 gpu가 아니라 cpu로 나오면 GPU 가속이 안 되고 있는 겁니다. 맥미니 M4라면 대부분 자동으로 Metal(GPU) 사용하는데, 혹시 cpu로 나온다면 Ollama를 최신 버전으로 업데이트해보세요.
❹ config.json 저장했는데 반영이 안 됨
VS Code를 완전히 종료하고 다시 열어야 할 때가 있습니다. 그냥 창 닫는 게 아니라 ⌘ + Q로 앱 자체를 종료하고 다시 실행해보세요.

📝 실제로 이런 것들 해봤는데 꽤 쓸 만합니다

솔직한 후기를 드리자면, Gemma 4 E4B로 이런 작업들은 Claude랑 비교해도 크게 차이 못 느꼈어요.

✅ Gemma 4 E4B로 충분히 잘 되는 것들
  • 함수 설명 써달라고 하기 — "이 함수 docstring 한국어로 써줘"
  • 짧은 함수 리팩터링 — "이 for loop를 list comprehension으로 바꿔줘"
  • 변수명이나 함수명 추천 — "이 기능에 어울리는 함수 이름 5개 추천해줘"
  • 간단한 버그 원인 설명 — "이 코드에서 None이 반환되는 이유가 뭐야?"
  • 코드 주석 달기 — 비어 있는 함수에 한국어 주석 채워넣기
⚠️ 이건 좀 아쉽긴 해요
  • 파일 여러 개에 걸친 복잡한 구조 이해는 Claude 쪽이 확실히 나음
  • 처음 응답이 시작되기까지 3~5초 정도 딜레이가 있어요. 급할 땐 좀 느리게 느껴짐
  • 자동완성이 맥락을 많이 못 잡을 때도 있음 — 엉뚱한 제안이 오기도 해요

그래도 돈 안 들고 내 코드 서버에 안 올라간다는 장점이 크죠. 간단한 작업은 이걸로 충분히 커버되고, 복잡한 거는 그때그때 Claude나 Gemini로 넘기는 식으로 섞어 쓰고 있습니다.

마치며

처음 설정할 때 config.json 파일 건드리는 게 좀 낯설 수 있는데, 한 번 해두면 그 다음부터는 그냥 VS Code 켜서 쓰면 끝입니다. Ollama 자동 시작까지 설정해두면 맥미니 켜지는 순간부터 Gemma 4가 대기 중인 상태가 되는 거라서 꽤 편해요. 유료 구독 없이 AI 코딩 보조를 쓰고 싶으신 분들한테는 한 번 해볼 만한 세팅이라고 생각합니다.

반응형