Cara resmi menghubungkan Pi ke Ollama adalah lewat server lokal — install Ollama di mesinmu, jalankan daemon-nya, baru Pi bisa pakai model cloud.1 Cara itu cocok kalau kamu memang sudah pakai Ollama untuk hal lain. Tapi kalau tidak mau urusan dengan daemon lokal — misalnya di container, WSL, atau mesin bersih — ada opsi yang lebih ringkas.
pi-ollama-cloud menghubungkan Pi langsung ke Ollama Cloud API.2 Tidak perlu server lokal, tidak perlu ollama CLI. Cukup API key dan satu perintah install.3
Prasyarat
Sebelum mulai, kamu butuh:
- Pi sudah terinstall:
npm install -g @earendil-works/pi-coding-agent - Ollama Cloud API key — daftar di ollama.com lalu buat key di ollama.com/settings/keys
Free tier tersedia untuk penggunaan ringan. Pro plan ($20/bulan) memberi 50× lebih banyak usage dan 3 concurrent model.
Install
Dari npm (direkomendasikan):
pi install npm:pi-ollama-cloud
Dari git:
pi install git:github.com/fgrehm/pi-ollama-cloud
Mau coba dulu tanpa install permanen? Pakai flag -e:
pi -e npm:pi-ollama-cloud
Setup
1. Dapatkan API Key
Buat API key di ollama.com/settings/keys.
2. Konfigurasi API Key
Cara termudah — dari dalam Pi, jalankan:
/login
Pilih Use an API key → Ollama Cloud → paste key kamu. Pi menyimpannya di ~/.pi/agent/auth.json, dan /logout untuk menghapusnya.
Alternatif lain, set environment variable:
export OLLAMA_API_KEY="your-key"
Atau tulis langsung ke ~/.pi/agent/auth.json:
{
"ollama-cloud": {
"type": "api_key",
"key": "your-key"
}
}
3. Nonaktifkan Web Tools (Opsional)
Secara default, extension mendaftarkan ollama_web_search dan ollama_web_fetch secara otomatis. Kalau tidak mau keduanya aktif, buat file ~/.pi/agent/ollama-cloud.json:
{
"webTools": false
}
Atau lewat env var: PI_OLLAMA_WEB_TOOLS=false.
Untuk scope per-project, buat .pi/ollama-cloud.json di root project — setting ini menang atas global.
4. Fetch Model (Opsional)
Pertama kali launch, extension pakai daftar model bawaan yang sudah di-bake — tidak ada network call, langsung bisa dipakai. Kalau mau daftar model terbaru dari API, jalankan dari dalam Pi:
/ollama-cloud-refresh
Setelah itu, cache lokal di ~/.pi/agent/cache/ollama-cloud-models.json dipakai setiap launch berikutnya. Cache lebih dari 30 hari di-refresh otomatis saat sesi berikutnya dimulai.
5. Pilih Model
Tekan Ctrl+L atau jalankan /model untuk ganti model. Model Ollama Cloud muncul di bawah provider ollama-cloud.
Perintah
| Perintah | Fungsi |
|---|---|
/ollama-cloud-refresh | Fetch model terbaru dari API, update cache, re-register provider |
/ollama-webtools [on|off] | Toggle web tools. Tanpa argumen = toggle |
Bedanya dengan ollama launch pi
ollama launch pi adalah setup resmi Ollama — satu perintah, Pi terhubung ke server Ollama lokal.1 Model cloud tersedia tapi diproxy lewat daemon lokal itu.
pi-ollama-cloud melewati server lokal sepenuhnya dan konek langsung ke ollama.com/v1:
| ollama launch pi | pi-ollama-cloud | |
|---|---|---|
| Provider | ollama | ollama-cloud |
| Endpoint | localhost:11434/v1 | ollama.com/v1 |
| Model lokal | ✅ | ❌ |
| Model cloud | ✅ via proxy lokal | ✅ langsung |
| Butuh Ollama lokal? | Ya | Tidak |
| Web tools | Install terpisah | Built-in |
Pakai ollama launch pi kalau sudah pakai Ollama untuk model lokal.
Pakai pi-ollama-cloud kalau hanya butuh cloud dan tidak mau daemon lokal.
Cara Kerja
Extension fetch daftar model dari dua endpoint Ollama Cloud:4
GET https://ollama.com/v1/models— list semua model IDPOST https://ollama.com/api/show— detail tiap model: capabilities (tools,thinking,vision) dan context length
Hanya model dengan capability tools yang didaftarkan — karena Pi butuh tool-calling.
Satu detail menarik: semua model tampil dengan biaya nol di Pi. Bukan karena gratis, tapi karena Ollama Cloud pakai langganan flat (Free/Pro/Max) — bukan per-token. Cost tracker Pi memang tidak relevan di sini.
Thinking Levels
Untuk model yang support thinking, Pi memetakan thinking level ke parameter reasoning_effort Ollama Cloud (none, low, medium, high, max).4
| Map | Model | Level yang tersedia |
|---|---|---|
| DEFAULT | Kebanyakan thinking model | off, low, medium, high, xhigh |
| GPT_OSS | gpt-oss* | low, medium, high |
| QWEN3 | qwen3* (kecuali qwen3-vl*) | off, medium |
| NO_OFF | qwen3-vl*, kimi-k2-thinking, minimax* | low, medium, high, xhigh |
Ringkasan
# Install
pi install npm:pi-ollama-cloud
# Set API key
export OLLAMA_API_KEY="your-key"
# atau via /login di dalam Pi
Lalu dari dalam Pi:
/ollama-cloud-refresh
Pilih model via Ctrl+L, mulai coding.