본문 바로가기

Ai 취미생활

안티그레비티 + Gemma 4 연동 가이드 — 맥미니 M4에서 완전 무료 로컬 AI 개발환경 만들기


[안티그레비티 Gemma 4 연동 가이드 대표 이미지 — 서버와 AI 모델이 연결되는 시각적 표현]
📌 이 글에서 알 수 있는 것
  • 왜 안티그레비티에 Gemma 4 로컬 모델을 연결하면 좋은지 (비용·프라이버시)
  • 맥미니 M4에서 어떤 Gemma 4 모델을 골라야 하는지 판단 기준
  • Ollama 설치 → 모델 다운로드 → 안티그레비티 연결까지 복붙 가능한 단계별 가이드

안티그레비티를 설치하고 처음 며칠은 정말 신났습니다.

Gemini 3 Pro가 코드를 알아서 짜주고, 에이전트가 터미널도 직접 돌리고. "아, 이게 진짜 AI 개발 도구구나" 싶었죠.

그런데 며칠 쓰다 보니 슬그머니 불안감이 올라왔습니다.

"내 코드가 Google 서버로 다 올라가는 거 아닌가?"
"회사 프로젝트 파일을 여기다 올려도 되나?"
"이걸 매일 쓰면 나중에 요금 폭탄 오는 거 아닐까?"

이 생각에 도달한 순간 떠오른 게 바로 맥미니에 이미 설치해둔 Gemma 4였습니다.

"잠깐, Gemma 4를 Ollama로 로컬에서 이미 돌리고 있잖아. 안티그레비티가 그걸 쓰게 할 수 있지 않을까?"

결론부터 말하면 됩니다. 그것도 생각보다 훨씬 간단하게.

🤔 왜 로컬 Gemma 4를 안티그레비티에 연결할까?

단순히 호기심이 아닙니다. 실질적인 이유 세 가지가 있습니다.

항목 클라우드 모델 (Gemini 등) 로컬 Gemma 4 (내 맥미니)
코드 보안 서버로 전송됨 내 맥미니 안에서만
비용 사용량에 따라 과금 완전 무료
인터넷 없을 때 사용 불가 그대로 동작
응답 속도 빠름 (서버 의존) M4 성능 의존
모델 품질 Gemini 3.1 Pro 수준 E4B 기준 GPT-3.5 수준
💡 현실적인 활용 전략: 간단한 코드 자동완성·리팩터링·주석 달기는 로컬 Gemma 4로 처리 → 클라우드 모델 요청 횟수를 아끼고, 복잡한 설계나 디버깅이 필요할 때만 Gemini 3.1 Pro나 Claude Opus로 전환. 실제 사용자들은 이 방식으로 월 클라우드 비용을 80% 절감했다는 후기가 있습니다.

🔍 맥미니 M4에서 어떤 Gemma 4 모델을 써야 할까?

Gemma 4는 크기별로 4가지 모델이 있습니다. 안티그레비티 연동용으로는 속도와 품질의 균형이 중요합니다.

모델 다운로드 크기 필요 RAM 속도 맥미니 M4 추천
E2B 약 3GB 8GB+ 매우 빠름 ✅ 16GB 기본형
E4B 약 5GB 10GB+ 빠름 ✅ 16GB 기본형 (추천)
26B (MoE) 약 17GB 24GB+ 보통 ⚠️ 24GB 이상만
31B 약 24GB 32GB+ 느림 ❌ 비권장
🎯 결론: 맥미니 M4 16GB 기본형이라면 E4B 모델을 권장합니다. E2B보다 응답 품질이 한 단계 높으면서도 메모리를 넉넉하게 남겨두어 안티그레비티와 동시 실행해도 버벅이지 않습니다. E2B는 메모리가 빡빡하게 느껴질 때 선택하세요.

📋 시작 전 체크리스트

  • Google 안티그레비티 설치 완료 (Google 안티그레비티(Antigravity) 완벽 가이드 참고)
  • Ollama 설치 완료 — 설치 안 됐다면 STEP 1에서 함께 진행
  • Gemma 4 모델 다운로드 완료 (E4B 권장, 약 5GB) — STEP 2에서 진행
  • 맥미니 M4 (macOS 13 이상) — 16GB 기본형도 E4B까지 가능
  • 인터넷 연결 — Ollama·모델 초기 다운로드 시 필요. 이후엔 없어도 동작

STEP 1 — Ollama 설치 확인 (이미 됐다면 STEP 2로)

Ollama가 이미 설치되어 있는지 먼저 확인합니다. 터미널(⌘+Space → "Terminal")을 열고 아래 명령어를 입력하세요.

# Ollama 버전 확인
ollama --version

버전 번호가 나오면 이미 설치된 것이니 STEP 2로 바로 이동하세요.

버전이 안 나온다면 (command not found), 아래 명령어로 설치합니다.

# macOS: Homebrew로 설치 (권장)
brew install ollama

# 또는 공식 설치 스크립트
curl -fsSL https://ollama.com/install.sh | sh

설치 후 다시 ollama --version을 실행해서 버전이 나오면 성공입니다.

STEP 2 — Gemma 4 모델 다운로드

이미 Gemma 4를 설치했다면 이 단계도 건너뛰어도 됩니다. 처음이라면 터미널에 아래 명령어를 입력하세요. 맥미니 M4 16GB 기준 E4B 모델을 권장합니다.

# E4B 모델 다운로드 (맥미니 M4 16GB 권장, 약 5GB)
ollama pull gemma4:e4b

# 메모리가 빡빡하면 E2B (약 3GB)
ollama pull gemma4:e2b

다운로드는 인터넷 속도에 따라 5~20분 정도 걸립니다. 진행 바가 표시되니 기다리면 됩니다.

다운로드 완료 확인:

# 설치된 모델 목록 확인
ollama list

# 출력 예시
NAME ID SIZE MODIFIED
gemma4:e4b a1b2c3d4e5f6 5.0 GB 2 minutes ago

STEP 3 — Ollama 서버 시작 & 확인

안티그레비티가 Gemma 4와 대화하려면 Ollama가 백그라운드에서 서버로 돌고 있어야 합니다. 새 터미널 탭을 열고 실행하세요.

# Ollama 서버 시작
ollama serve

아래처럼 뜨면 정상 작동 중입니다.

2026/04/29 10:00:00 Listening on 127.0.0.1:11434 (version 0.x.x)

이 탭은 닫지 말고 그대로 두세요. 서버를 계속 살려둬야 안티그레비티가 연결됩니다.

💡 부팅할 때 자동 시작하게 하려면:
brew services start ollama 를 실행하면 맥미니가 켜질 때 Ollama가 자동으로 시작됩니다. 매번 터미널에서 켜줄 필요가 없어서 편합니다.

STEP 4 — 안티그레비티에 Gemma 4 등록하기 (핵심!)

드디어 핵심 단계입니다. 안티그레비티 안에서 로컬 Gemma 4를 쓸 수 있도록 모델을 등록해줘야 합니다.

① 안티그레비티 설정 열기

⌘ + ,

를 눌러 Settings(설정)를 엽니다. 좌측 메뉴에서 Models 탭을 클릭하세요.

② Add Custom Model 클릭

Models 탭 하단 또는 우측 상단에 있는 "+ Add Model" 또는 "Add Custom Model" 버튼을 클릭합니다.

③ 아래 정보를 입력합니다

입력 항목 입력할 값 설명
Provider Name Ollama Local 이름은 자유롭게 — 나중에 구분용
Base URL http://localhost:11434/v1 /v1 필수! 없으면 연결 안 됨
API Key ollama 실제로 사용 안 함. 빈칸이면 오류나서 아무 문자나 입력
Model Name gemma4:e4b ollama list에서 나온 이름 그대로 입력
⚠️ 가장 흔한 실수: Base URL에 http://localhost:11434 만 입력하면 연결이 안 됩니다. 반드시 뒤에 /v1을 붙여야 합니다. (http://localhost:11434/v1)

④ Save 클릭

저장하면 Models 목록에 "Ollama Local" (또는 입력한 이름)이 추가됩니다.

STEP 5 — 연결 테스트 (제대로 됐는지 확인)

설정이 완료됐으면 실제로 연결이 됐는지 확인해봅니다.

① 인라인 채팅 열기

⌘ + L

을 눌러 AI 채팅 패널을 엽니다.

② 모델 전환

채팅 상단의 모델 드롭다운을 클릭하면 방금 추가한 "Ollama Local / gemma4:e4b"가 보입니다. 선택하세요.

③ 간단한 질문으로 테스트

# 채팅창에 입력
"Python으로 Hello World 출력하는 코드 짜줘"

몇 초 후 Gemma 4가 응답하면 성공입니다. 처음 응답은 모델 로딩 시간 때문에 10~30초 정도 걸릴 수 있습니다. 이후부터는 빠르게 응답합니다.

🔍 연결 실패 시 체크리스트
  • Ollama 서버가 실행 중인지 확인 (ollama serve 실행됐는지)
  • Base URL에 /v1이 붙어있는지 재확인
  • Model Name이 ollama list 출력과 완전히 일치하는지 확인
  • 브라우저에서 http://localhost:11434 접속 → "Ollama is running" 문구가 뜨면 서버 정상

📊 Gemma 4 로컬이 잘 맞는 작업 vs 한계가 있는 작업

로컬 모델이 만능은 아닙니다. 어떤 작업에 쓰면 좋고 어떤 건 클라우드 모델에 맡겨야 하는지 알면, 둘을 적절히 섞어 쓸 수 있습니다.

✅ Gemma 4 로컬이 잘하는 것 ⚠️ 클라우드 모델에 맡기는 게 나은 것
코드 자동완성, 탭 완성 복잡한 아키텍처 설계
간단한 함수 리팩터링 멀티 파일에 걸친 대규모 리팩터링
주석 달기, 변수명 개선 복잡한 에이전트 체인 실행
간단한 버그 설명 5개 이상의 도구 호출이 필요한 작업
코드 설명·번역 외부 API 연동이 필요한 작업
민감한 코드 분석 (서버 전송 없이) 최신 기술 스택 관련 심층 질문
💡 한 가지 팁: 로컬 모델은 도구 호출(tool call) JSON을 복잡하게 다루는 걸 어려워합니다. 에이전트 작업에 사용하는 도구가 1~2개 이내일 때는 잘 작동하지만, 그 이상이면 응답이 형식을 벗어나는 경우가 있습니다. 에이전트 복잡 작업은 Gemini나 Claude에게 맡기는 게 안전합니다.

🎁 보너스 — OpenClaw에서 안티그레비티 + Gemma 연동 활용하기

안티그레비티와 Gemma 4 로컬 연동이 완성됐다면, OpenClaw 오케스트레이터 구조와 결합하면 더 강력해집니다.

🔗 전체 흐름 예시
  1. 텔레그램 명령: "현재 프로젝트 코드에서 성능 문제 있는 함수 찾아서 개선안 만들어줘"
  2. OpenClaw (Gemma 4 E4B): 명령 해석 → 안티그레비티에 작업 지시
  3. 안티그레비티 에이전트: 로컬 Gemma 4로 코드 분석 → 성능 병목 함수 발견 → 개선 코드 작성 → diff 생성
  4. OpenClaw: 결과 수신 → "분석 완료. 3개 함수 개선안 준비됐어요" 텔레그램 전송

코드가 외부 서버로 한 번도 나가지 않고 이 모든 흐름이 맥미니 안에서 완결됩니다. 이게 로컬 AI 스택의 진짜 가치입니다.

💬 마치며

처음 안티그레비티에 Gemma 4를 연결했을 때 솔직히 반신반의했습니다. "로컬 모델이 얼마나 되겠어?" 하고요. 근데 코드 자동완성이나 간단한 리팩터링은 생각보다 훨씬 빠르고 쓸만했습니다. 무엇보다 내 코드가 어디에도 안 올라간다는 안도감은 생각보다 크게 다가왔습니다. 5단계, 길어 보이지만 실제로 해보면 30분이면 끝납니다. 한 번 해두면 맥미니가 꺼지지 않는 한 계속 쓸 수 있습니다.

반응형