- 왜 안티그레비티에 Gemma 4 로컬 모델을 연결하면 좋은지 (비용·프라이버시)
- 맥미니 M4에서 어떤 Gemma 4 모델을 골라야 하는지 판단 기준
- Ollama 설치 → 모델 다운로드 → 안티그레비티 연결까지 복붙 가능한 단계별 가이드
안티그레비티를 설치하고 처음 며칠은 정말 신났습니다.
Gemini 3 Pro가 코드를 알아서 짜주고, 에이전트가 터미널도 직접 돌리고. "아, 이게 진짜 AI 개발 도구구나" 싶었죠.
그런데 며칠 쓰다 보니 슬그머니 불안감이 올라왔습니다.
"회사 프로젝트 파일을 여기다 올려도 되나?"
"이걸 매일 쓰면 나중에 요금 폭탄 오는 거 아닐까?"
이 생각에 도달한 순간 떠오른 게 바로 맥미니에 이미 설치해둔 Gemma 4였습니다.
"잠깐, Gemma 4를 Ollama로 로컬에서 이미 돌리고 있잖아. 안티그레비티가 그걸 쓰게 할 수 있지 않을까?"
결론부터 말하면 됩니다. 그것도 생각보다 훨씬 간단하게.
🤔 왜 로컬 Gemma 4를 안티그레비티에 연결할까?
단순히 호기심이 아닙니다. 실질적인 이유 세 가지가 있습니다.
| 항목 | 클라우드 모델 (Gemini 등) | 로컬 Gemma 4 (내 맥미니) |
|---|---|---|
| 코드 보안 | 서버로 전송됨 | 내 맥미니 안에서만 |
| 비용 | 사용량에 따라 과금 | 완전 무료 |
| 인터넷 없을 때 | 사용 불가 | 그대로 동작 |
| 응답 속도 | 빠름 (서버 의존) | M4 성능 의존 |
| 모델 품질 | Gemini 3.1 Pro 수준 | E4B 기준 GPT-3.5 수준 |
🔍 맥미니 M4에서 어떤 Gemma 4 모델을 써야 할까?
Gemma 4는 크기별로 4가지 모델이 있습니다. 안티그레비티 연동용으로는 속도와 품질의 균형이 중요합니다.
| 모델 | 다운로드 크기 | 필요 RAM | 속도 | 맥미니 M4 추천 |
|---|---|---|---|---|
| E2B | 약 3GB | 8GB+ | 매우 빠름 | ✅ 16GB 기본형 |
| E4B | 약 5GB | 10GB+ | 빠름 | ✅ 16GB 기본형 (추천) |
| 26B (MoE) | 약 17GB | 24GB+ | 보통 | ⚠️ 24GB 이상만 |
| 31B | 약 24GB | 32GB+ | 느림 | ❌ 비권장 |
📋 시작 전 체크리스트
- Google 안티그레비티 설치 완료 (Google 안티그레비티(Antigravity) 완벽 가이드 참고)
- Ollama 설치 완료 — 설치 안 됐다면 STEP 1에서 함께 진행
- Gemma 4 모델 다운로드 완료 (E4B 권장, 약 5GB) — STEP 2에서 진행
- 맥미니 M4 (macOS 13 이상) — 16GB 기본형도 E4B까지 가능
- 인터넷 연결 — Ollama·모델 초기 다운로드 시 필요. 이후엔 없어도 동작
STEP 1 — Ollama 설치 확인 (이미 됐다면 STEP 2로)
Ollama가 이미 설치되어 있는지 먼저 확인합니다. 터미널(⌘+Space → "Terminal")을 열고 아래 명령어를 입력하세요.
ollama --version
버전 번호가 나오면 이미 설치된 것이니 STEP 2로 바로 이동하세요.
버전이 안 나온다면 (command not found), 아래 명령어로 설치합니다.
brew install ollama
# 또는 공식 설치 스크립트
curl -fsSL https://ollama.com/install.sh | sh
설치 후 다시 ollama --version을 실행해서 버전이 나오면 성공입니다.
STEP 2 — Gemma 4 모델 다운로드
이미 Gemma 4를 설치했다면 이 단계도 건너뛰어도 됩니다. 처음이라면 터미널에 아래 명령어를 입력하세요. 맥미니 M4 16GB 기준 E4B 모델을 권장합니다.
ollama pull gemma4:e4b
# 메모리가 빡빡하면 E2B (약 3GB)
ollama pull gemma4:e2b
다운로드는 인터넷 속도에 따라 5~20분 정도 걸립니다. 진행 바가 표시되니 기다리면 됩니다.
다운로드 완료 확인:
ollama list
# 출력 예시
NAME ID SIZE MODIFIED
gemma4:e4b a1b2c3d4e5f6 5.0 GB 2 minutes ago
STEP 3 — Ollama 서버 시작 & 확인
안티그레비티가 Gemma 4와 대화하려면 Ollama가 백그라운드에서 서버로 돌고 있어야 합니다. 새 터미널 탭을 열고 실행하세요.
ollama serve
아래처럼 뜨면 정상 작동 중입니다.
이 탭은 닫지 말고 그대로 두세요. 서버를 계속 살려둬야 안티그레비티가 연결됩니다.
brew services start ollama 를 실행하면 맥미니가 켜질 때 Ollama가 자동으로 시작됩니다. 매번 터미널에서 켜줄 필요가 없어서 편합니다.STEP 4 — 안티그레비티에 Gemma 4 등록하기 (핵심!)
드디어 핵심 단계입니다. 안티그레비티 안에서 로컬 Gemma 4를 쓸 수 있도록 모델을 등록해줘야 합니다.
① 안티그레비티 설정 열기
⌘ + ,를 눌러 Settings(설정)를 엽니다. 좌측 메뉴에서 Models 탭을 클릭하세요.
② Add Custom Model 클릭
Models 탭 하단 또는 우측 상단에 있는 "+ Add Model" 또는 "Add Custom Model" 버튼을 클릭합니다.
③ 아래 정보를 입력합니다
| 입력 항목 | 입력할 값 | 설명 |
|---|---|---|
| Provider Name | Ollama Local |
이름은 자유롭게 — 나중에 구분용 |
| Base URL | http://localhost:11434/v1 |
/v1 필수! 없으면 연결 안 됨 |
| API Key | ollama |
실제로 사용 안 함. 빈칸이면 오류나서 아무 문자나 입력 |
| Model Name | gemma4:e4b |
ollama list에서 나온 이름 그대로 입력 |
http://localhost:11434 만 입력하면 연결이 안 됩니다. 반드시 뒤에 /v1을 붙여야 합니다. (http://localhost:11434/v1)④ Save 클릭
저장하면 Models 목록에 "Ollama Local" (또는 입력한 이름)이 추가됩니다.
STEP 5 — 연결 테스트 (제대로 됐는지 확인)
설정이 완료됐으면 실제로 연결이 됐는지 확인해봅니다.
① 인라인 채팅 열기
⌘ + L을 눌러 AI 채팅 패널을 엽니다.
② 모델 전환
채팅 상단의 모델 드롭다운을 클릭하면 방금 추가한 "Ollama Local / gemma4:e4b"가 보입니다. 선택하세요.
③ 간단한 질문으로 테스트
"Python으로 Hello World 출력하는 코드 짜줘"
몇 초 후 Gemma 4가 응답하면 성공입니다. 처음 응답은 모델 로딩 시간 때문에 10~30초 정도 걸릴 수 있습니다. 이후부터는 빠르게 응답합니다.
- Ollama 서버가 실행 중인지 확인 (
ollama serve실행됐는지) - Base URL에
/v1이 붙어있는지 재확인 - Model Name이
ollama list출력과 완전히 일치하는지 확인 - 브라우저에서
http://localhost:11434접속 → "Ollama is running" 문구가 뜨면 서버 정상
📊 Gemma 4 로컬이 잘 맞는 작업 vs 한계가 있는 작업
로컬 모델이 만능은 아닙니다. 어떤 작업에 쓰면 좋고 어떤 건 클라우드 모델에 맡겨야 하는지 알면, 둘을 적절히 섞어 쓸 수 있습니다.
| ✅ Gemma 4 로컬이 잘하는 것 | ⚠️ 클라우드 모델에 맡기는 게 나은 것 |
|---|---|
| 코드 자동완성, 탭 완성 | 복잡한 아키텍처 설계 |
| 간단한 함수 리팩터링 | 멀티 파일에 걸친 대규모 리팩터링 |
| 주석 달기, 변수명 개선 | 복잡한 에이전트 체인 실행 |
| 간단한 버그 설명 | 5개 이상의 도구 호출이 필요한 작업 |
| 코드 설명·번역 | 외부 API 연동이 필요한 작업 |
| 민감한 코드 분석 (서버 전송 없이) | 최신 기술 스택 관련 심층 질문 |
🎁 보너스 — OpenClaw에서 안티그레비티 + Gemma 연동 활용하기
안티그레비티와 Gemma 4 로컬 연동이 완성됐다면, OpenClaw 오케스트레이터 구조와 결합하면 더 강력해집니다.
- 텔레그램 명령: "현재 프로젝트 코드에서 성능 문제 있는 함수 찾아서 개선안 만들어줘"
- OpenClaw (Gemma 4 E4B): 명령 해석 → 안티그레비티에 작업 지시
- 안티그레비티 에이전트: 로컬 Gemma 4로 코드 분석 → 성능 병목 함수 발견 → 개선 코드 작성 → diff 생성
- OpenClaw: 결과 수신 → "분석 완료. 3개 함수 개선안 준비됐어요" 텔레그램 전송
코드가 외부 서버로 한 번도 나가지 않고 이 모든 흐름이 맥미니 안에서 완결됩니다. 이게 로컬 AI 스택의 진짜 가치입니다.
처음 안티그레비티에 Gemma 4를 연결했을 때 솔직히 반신반의했습니다. "로컬 모델이 얼마나 되겠어?" 하고요. 근데 코드 자동완성이나 간단한 리팩터링은 생각보다 훨씬 빠르고 쓸만했습니다. 무엇보다 내 코드가 어디에도 안 올라간다는 안도감은 생각보다 크게 다가왔습니다. 5단계, 길어 보이지만 실제로 해보면 30분이면 끝납니다. 한 번 해두면 맥미니가 꺼지지 않는 한 계속 쓸 수 있습니다.
'Ai 취미생활' 카테고리의 다른 글
| VS Code에서 Gemma 4 로컬 AI 쓰는 방법 - GitHub Copilot 없이 (0) | 2026.05.06 |
|---|---|
| 코딩 몰라도 됩니다 - 안티그레비티 바이브 코딩으로 바이낸스 자동매매 프로그램 만들기 (3) | 2026.04.30 |
| Google 안티그레비티(Antigravity) 완벽 가이드 — AI 에이전트 IDE 설치부터 실전 사용법까지 (0) | 2026.04.29 |
| OpenClaw 실전 활용 사례 총정리 — 개인·투자·개발·비즈니스 분야별 자동화 아이디어 (3) | 2026.04.27 |
| 맥미니 M4에 OpenClaw + Gemma 4 무료 로컬 AI 설치하기 — Ollama 연동 완전 가이드 (0) | 2026.04.21 |