Ollama Nasıl Kullanılır? Kendi Bilgisayarınızda Yerel Yapay Zeka Modeli Çalıştırma Rehberi

Yapay zeka sohbet araçlarının çoğu için verilerinizi bir bulut sunucusuna göndermeniz gerekir. Peki ya tüm bunları internet bağlantısına ihtiyaç duymadan, ücretsiz ve gizliliğinizi koruyarak kendi bilgisayarınızda çalıştırabilseydiniz? İşte tam bu noktada devreye giren Ollama’nın nasıl kullanılacağını bu rehberde adım adım ele alacağız.
Kurulumdan ilk modeli çalıştırmaya, komut satırından Python ve REST API entegrasyonuna kadar her aşamayı sizler için derledik. Teknik bir altyapınız olmasa bile, bu yazının sonunda kendi bilgisayarınızda bir büyük dil modelini (LLM) sorunsuz çalıştırabiliyor olacaksınız.

İçerik Başlıkları
Ollama Nedir?
Ollama, büyük dil modellerini (LLM – Large Language Model) kendi bilgisayarınızda yerel olarak çalıştırmanızı sağlayan açık kaynaklı bir araçtır. Normalde bu tür modelleri kurmak; karmaşık bağımlılıklar, sürücü ayarları ve uzun yapılandırmalar gerektirir. Ollama ise tüm bu süreci tek bir komuta indirger.
Kısaca Ollama, modeli indirme, belleğe yükleme ve sizinle konuşturma işlerini sizin yerinize halleder. Meta’nın Llama, Google’ın Gemma, Mistral ve DeepSeek gibi popüler modelleri tek satır komutla indirip anında kullanmaya başlayabilirsiniz.
Yerel modeller dünyasına yeni adım atıyorsanız, hangi modelin ne işe yaradığını öğrenmek için Yerel (Local) AI Modelleri Nelerdir? başlıklı yazımız iyi bir başlangıç noktası olacaktır.
Ollama Kullanmanın Avantajları Nelerdir?
Ollama’yı bulut tabanlı yapay zeka servislerine tercih etmenizin somut sebepleri vardır:
- Gizlilik: Yazdığınız her şey bilgisayarınızda kalır; hiçbir veri dışarı gönderilmez.
- Ücretsiz kullanım: Abonelik ücreti veya jeton (token) başına ödeme yoktur.
- Çevrimdışı erişim: Model bir kez indirildikten sonra internet olmadan da çalışır.
- Esneklik: Farklı modelleri deneyebilir, kendi özel asistanınızı oluşturabilirsiniz.
Ollama Kurulumu Nasıl Yapılır?
Ollama’nın nasıl kullanılacağını öğrenmenin ilk adımı kurulumdur. Aracı Windows, macOS ve Linux için resmi Ollama web sitesinden ücretsiz indirebilirsiniz. İşletim sisteminize göre izlemeniz gereken yol biraz değişir.

Windows ve macOS için Kurulum
Windows ve macOS kullanıcıları için en pratik yöntem, resmi siteden indirilen yükleyiciyi (installer) çalıştırmaktır. İndirme tamamlandığında kurulum dosyasına çift tıklayıp adımları takip etmeniz yeterlidir. Kurulum bittiğinde Ollama arka planda bir servis olarak çalışmaya başlar.
Komut satırını seven Windows kullanıcıları ise tek satırda kurulum yapabilir:
winget install Ollama.Ollama
macOS’ta Homebrew kullanıyorsanız terminale brew install ollama yazmanız da yeterli olacaktır.
Linux için Kurulum
Linux tarafında işler daha da hızlıdır. Tek bir kurulum betiği (script) Ollama’yı indirir, kurar ve servisi otomatik başlatır:
curl -fsSL https://ollama.com/install.sh | sh
Kurulumun başarılı olup olmadığını her platformda aynı şekilde doğrulayabilirsiniz. Terminale aşağıdaki komutu yazıp bir sürüm numarası görüyorsanız her şey hazır demektir:
ollama --version
Komut Satırı ile Model Nasıl Çalıştırılır?
Ollama’nın kalbi komut satırıdır. İlk yapay zeka modelinizi çalıştırmak için tek bir komut yeterlidir. Örneğin Meta’nın Llama 3.2 modelini indirip sohbete başlamak için terminale şunu yazın:
ollama run llama3.2
Bu komut modeli ilk seferde otomatik indirir, ardından karşınıza bir sohbet ekranı (prompt) açar. Artık tıpkı bir sohbet robotuyla konuşur gibi sorularınızı yazabilirsiniz. Sohbetten çıkmak için /bye yazmanız yeterlidir.

En Sık Kullanılan Ollama Komutları
Günlük kullanımda işinize yarayacak temel Ollama komutlarını kısaca listeleyelim:
ollama pull <model>— Modeli çalıştırmadan yalnızca indirir.ollama run <model>— Modeli indirir (gerekirse) ve sohbeti başlatır.ollama list— Bilgisayarınızdaki yüklü modelleri listeler.ollama ps— O an çalışan (belleğe yüklü) modelleri gösterir.ollama rm <model>— Bir modeli bilgisayarınızdan siler.ollama serve— API sunucusunu manuel olarak başlatır.
Tek seferlik bir soru sormak isterseniz sohbet ekranı açmadan da çalışabilirsiniz: ollama run llama3.2 "Türkiye'nin başkenti neresidir?" komutu doğrudan yanıtı döndürür.
Hangi Modeli Seçmelisiniz?
Ollama yüzlerce modeli destekler, ama hepsi her bilgisayarda akıcı çalışmaz. Model seçiminde belirleyici unsur, modelin parametre boyutu ve bilgisayarınızın belleğidir (RAM/VRAM). Genel kural şudur: model büyüdükçe daha akıllı olur, ama daha fazla bellek ister.
Aşağıdaki tablo, popüler modelleri ve kabaca ihtiyaç duydukları belleği özetler:
| Model | Boyut | Önerilen Bellek | Uygun Kullanım |
|---|---|---|---|
| Phi / Gemma (küçük) | ~3-4B | ~4-8 GB | Hızlı, günlük sorular |
| Llama 3.2 / Mistral | ~7-8B | ~8-16 GB | Genel amaçlı, dengeli |
| DeepSeek-R1 | ~8B+ | ~16 GB | Akıl yürütme, kodlama |
| Llama 3.3 (büyük) | ~70B | 32 GB ve üzeri | En yüksek kalite |
Başlangıç için llama3.2 veya gemma gibi 7-8 milyar parametreli bir model çoğu bilgisayarda dengeli bir deneyim sunar. Donanımınızı zorlamadan yapabileceklerinizi merak ediyorsanız ASUS Ascent GX10 ile yerel AI modelleri yazımız fikir verebilir.
Ollama Python ile Nasıl Kullanılır?
Ollama’yı yalnızca sohbet için değil, kendi uygulamalarınızın motoru olarak da kullanabilirsiniz. Bunun en kolay yolu resmi Python kütüphanesidir. Önce kütüphaneyi kurun:
pip install ollama

Kurulumdan sonra birkaç satır kodla yerel modelinize soru sorabilirsiniz. Aşağıdaki örnek, chat fonksiyonunu kullanarak modele bir mesaj gönderir:
import ollamayanit = ollama.chat(model='llama3.2', messages=[{'role':'user','content':'Merhaba, nasılsın?'}])print(yanit['message']['content'])
Uzun yanıtları kelime kelime ekrana akıtmak (streaming) isterseniz chat çağrısına stream=True parametresini ekleyip dönen yanıt üzerinde döngü kurmanız yeterlidir. Python ile yapay zekaya ilgi duyuyorsanız, yazılım öğrenmek için ücretsiz sertifikalı kurslar listemiz temel programlama becerinizi geliştirmenize yardımcı olur.
Ollama REST API Nasıl Çalışır?
Ollama, kurulduğu anda arka planda bir REST API sunucusu başlatır. Bu sunucu varsayılan olarak http://localhost:11434 adresinde çalışır. Yani Python dışında herhangi bir programlama dilinden veya doğrudan terminalden de modellerinize erişebilirsiniz.
En çok kullanılan uç noktalar (endpoint) şunlardır:
/api/generate— Tek seferlik metin üretimi./api/chat— Rol tabanlı sohbet (sistem/kullanıcı mesajları)./api/tags— Yüklü modellerin listesi.
Örneğin terminalden basit bir istek göndermek için curl komutunu kullanabilirsiniz. Bu API sayesinde Ollama’yı kendi web siteniz, masaüstü uygulamanız veya otomasyon akışlarınızla birleştirmeniz mümkün hale gelir.
Arayüz (GUI) ile Kullanmak İsteyenler İçin Seçenekler
Komut satırı herkese hitap etmeyebilir. Eğer ChatGPT benzeri, fare ile tıklanan bir arayüz tercih ediyorsanız Ollama’nın üzerine çalışan grafik arayüzlerden (GUI) yararlanabilirsiniz.

En popüler seçenek, tarayıcı üzerinden çalışan ve sohbet geçmişi, model değiştirme gibi özellikler sunan Open WebUI‘dir. Bunun yanında masaüstü uygulamaları ve VS Code eklentileri de Ollama’yı görsel olarak kullanmanıza imkan tanır. Bu araçlar arka planda yine yukarıda anlattığımız REST API ile haberleşir; yani Ollama çalışırken siz sadece şık bir arayüz görürsünüz.
Görsel araçlarla yerel yapay zeka üretiminin sınırlarını merak ediyorsanız, düğüm tabanlı bir başka güçlü araç olan ComfyUI’nin nasıl kullanıldığını anlattığımız rehbere de göz atabilirsiniz.
Sık Karşılaşılan Sorunlar ve İpuçları
Ollama oldukça kararlı çalışsa da yeni başlayanların takıldığı birkaç nokta vardır. İşte pratik çözümler:
- Model çok yavaş yanıt veriyor: Daha küçük bir modele geçin (örneğin 70B yerine 8B). Bellek yetersizse model diske taşar ve yavaşlar.
- Bağlantı hatası alıyorum: API’nin çalıştığından emin olmak için
ollama servekomutunu kontrol edin. - Disk doluyor: Modeller gigabaytlarca yer kaplar; kullanmadıklarınızı
ollama rmile silin. - Kendi asistanımı oluşturmak istiyorum: Bir
Modelfiledosyasıyla sistem talimatı ve sıcaklık (temperature) gibi ayarları özelleştirebilirsiniz.
Yapay zekayı geliştirme süreçlerinize entegre etmek isteyen yazılımcılar için en iyi AI kod asistanları karşılaştırmamız da Ollama’yı tamamlayan güçlü bir kaynaktır.
Sonuç
Gördüğünüz gibi Ollama’nın nasıl kullanılacağı hiç de karmaşık değil. Tek bir kurulum, tek bir ollama run komutu ve birkaç dakika içinde kendi bilgisayarınızda çalışan, gizli ve ücretsiz bir yapay zeka asistanına sahip oluyorsunuz. Komut satırından Python’a, REST API’den grafik arayüzlere kadar her seviyeye uygun bir yol mutlaka var.
Eğer yerel yapay zeka modelleri ilginizi çekiyorsa, sitemizde yer alan “Yerel (Local) AI Modelleri Nelerdir? 2026’nın Öne Çıkan Modelleri” adlı yazımıza da göz atarak hangi modelle başlayacağınıza daha kolay karar verebilirsiniz.
