Ollama Nasıl Kullanılır? Yerel LLM Kurulum Rehberi

Reklam

Yapay zeka sohbet araçlarının çoğu için verilerinizi bir bulut sunucusuna göndermeniz gerekir. Peki ya tüm bunları internet bağlantısına ihtiyaç duymadan, ücretsiz ve gizliliğinizi koruyarak kendi bilgisayarınızda çalıştırabilseydiniz? İşte tam bu noktada devreye giren Ollama’nın nasıl kullanılacağını bu rehberde adım adım ele alacağız.

Kurulumdan ilk modeli çalıştırmaya, komut satırından Python ve REST API entegrasyonuna kadar her aşamayı sizler için derledik. Teknik bir altyapınız olmasa bile, bu yazının sonunda kendi bilgisayarınızda bir büyük dil modelini (LLM) sorunsuz çalıştırabiliyor olacaksınız.

Ollama terminalde llama3 modeli ile yapay zeka sohbeti yerel LLM kullanimi ornegi — Ollama CLI terminali: llama3 modeliyle gerçek bir yerel yapay zeka sohbeti (Wikimedia Commons, CC BY 4.0)

İçerik Başlıkları

1 Ollama Nedir?
- 1.1 Ollama Kullanmanın Avantajları Nelerdir?
2 Ollama Kurulumu Nasıl Yapılır?
- 2.1 Windows ve macOS için Kurulum
- 2.2 Linux için Kurulum
3 Komut Satırı ile Model Nasıl Çalıştırılır?
- 3.1 En Sık Kullanılan Ollama Komutları
4 Hangi Modeli Seçmelisiniz?
5 Ollama Python ile Nasıl Kullanılır?
6 Ollama REST API Nasıl Çalışır?
7 Arayüz (GUI) ile Kullanmak İsteyenler İçin Seçenekler
8 Sık Karşılaşılan Sorunlar ve İpuçları
9 Sonuç

Reklam

Ollama Nedir?

Ollama, büyük dil modellerini (LLM – Large Language Model) kendi bilgisayarınızda yerel olarak çalıştırmanızı sağlayan açık kaynaklı bir araçtır. Normalde bu tür modelleri kurmak; karmaşık bağımlılıklar, sürücü ayarları ve uzun yapılandırmalar gerektirir. Ollama ise tüm bu süreci tek bir komuta indirger.

Kısaca Ollama, modeli indirme, belleğe yükleme ve sizinle konuşturma işlerini sizin yerinize halleder. Meta’nın Llama, Google’ın Gemma, Mistral ve DeepSeek gibi popüler modelleri tek satır komutla indirip anında kullanmaya başlayabilirsiniz.

Yerel modeller dünyasına yeni adım atıyorsanız, hangi modelin ne işe yaradığını öğrenmek için Yerel (Local) AI Modelleri Nelerdir? başlıklı yazımız iyi bir başlangıç noktası olacaktır.

Ollama Kullanmanın Avantajları Nelerdir?

Ollama’yı bulut tabanlı yapay zeka servislerine tercih etmenizin somut sebepleri vardır:

Gizlilik: Yazdığınız her şey bilgisayarınızda kalır; hiçbir veri dışarı gönderilmez.
Ücretsiz kullanım: Abonelik ücreti veya jeton (token) başına ödeme yoktur.
Çevrimdışı erişim: Model bir kez indirildikten sonra internet olmadan da çalışır.
Esneklik: Farklı modelleri deneyebilir, kendi özel asistanınızı oluşturabilirsiniz.

Ollama Kurulumu Nasıl Yapılır?

Ollama’nın nasıl kullanılacağını öğrenmenin ilk adımı kurulumdur. Aracı Windows, macOS ve Linux için resmi Ollama web sitesinden ücretsiz indirebilirsiniz. İşletim sisteminize göre izlemeniz gereken yol biraz değişir.

Ollama ve OpenClaw logolari, yerel yapay zeka model destegi gosteren platform gorseli — Ollama resmi platform logosu: Windows, macOS ve Linux desteği sunan yerel LLM aracı (ollama.com)

Windows ve macOS için Kurulum

Windows ve macOS kullanıcıları için en pratik yöntem, resmi siteden indirilen yükleyiciyi (installer) çalıştırmaktır. İndirme tamamlandığında kurulum dosyasına çift tıklayıp adımları takip etmeniz yeterlidir. Kurulum bittiğinde Ollama arka planda bir servis olarak çalışmaya başlar.

Komut satırını seven Windows kullanıcıları ise tek satırda kurulum yapabilir:

winget install Ollama.Ollama

macOS’ta Homebrew kullanıyorsanız terminale brew install ollama yazmanız da yeterli olacaktır.

Linux için Kurulum

Linux tarafında işler daha da hızlıdır. Tek bir kurulum betiği (script) Ollama’yı indirir, kurar ve servisi otomatik başlatır:

curl -fsSL https://ollama.com/install.sh | sh

Kurulumun başarılı olup olmadığını her platformda aynı şekilde doğrulayabilirsiniz. Terminale aşağıdaki komutu yazıp bir sürüm numarası görüyorsanız her şey hazır demektir:

ollama --version

Komut Satırı ile Model Nasıl Çalıştırılır?

Ollama’nın kalbi komut satırıdır. İlk yapay zeka modelinizi çalıştırmak için tek bir komut yeterlidir. Örneğin Meta’nın Llama 3.2 modelini indirip sohbete başlamak için terminale şunu yazın:

ollama run llama3.2

Bu komut modeli ilk seferde otomatik indirir, ardından karşınıza bir sohbet ekranı (prompt) açar. Artık tıpkı bir sohbet robotuyla konuşur gibi sorularınızı yazabilirsiniz. Sohbetten çıkmak için /bye yazmanız yeterlidir.

Terminalde ollama run llama3 komutu ile yerel yapay zeka modeli calistirma ve sohbet ekrani — Terminalde “ollama run llama3” komutu ve açılan “>>>” sohbet istemi: modeli tek komutla çalıştırma (Wikimedia Commons, CC BY 4.0)

En Sık Kullanılan Ollama Komutları

Günlük kullanımda işinize yarayacak temel Ollama komutlarını kısaca listeleyelim:

ollama pull <model> — Modeli çalıştırmadan yalnızca indirir.
ollama run <model> — Modeli indirir (gerekirse) ve sohbeti başlatır.
ollama list — Bilgisayarınızdaki yüklü modelleri listeler.
ollama ps — O an çalışan (belleğe yüklü) modelleri gösterir.
ollama rm <model> — Bir modeli bilgisayarınızdan siler.
ollama serve — API sunucusunu manuel olarak başlatır.

Tek seferlik bir soru sormak isterseniz sohbet ekranı açmadan da çalışabilirsiniz: ollama run llama3.2 "Türkiye'nin başkenti neresidir?" komutu doğrudan yanıtı döndürür.

Hangi Modeli Seçmelisiniz?

Ollama yüzlerce modeli destekler, ama hepsi her bilgisayarda akıcı çalışmaz. Model seçiminde belirleyici unsur, modelin parametre boyutu ve bilgisayarınızın belleğidir (RAM/VRAM). Genel kural şudur: model büyüdükçe daha akıllı olur, ama daha fazla bellek ister.

Aşağıdaki tablo, popüler modelleri ve kabaca ihtiyaç duydukları belleği özetler:

Model	Boyut	Önerilen Bellek	Uygun Kullanım
Phi / Gemma (küçük)	~3-4B	~4-8 GB	Hızlı, günlük sorular
Llama 3.2 / Mistral	~7-8B	~8-16 GB	Genel amaçlı, dengeli
DeepSeek-R1	~8B+	~16 GB	Akıl yürütme, kodlama
Llama 3.3 (büyük)	~70B	32 GB ve üzeri	En yüksek kalite

Başlangıç için llama3.2 veya gemma gibi 7-8 milyar parametreli bir model çoğu bilgisayarda dengeli bir deneyim sunar. Donanımınızı zorlamadan yapabileceklerinizi merak ediyorsanız ASUS Ascent GX10 ile yerel AI modelleri yazımız fikir verebilir.

Ollama Python ile Nasıl Kullanılır?

Ollama’yı yalnızca sohbet için değil, kendi uygulamalarınızın motoru olarak da kullanabilirsiniz. Bunun en kolay yolu resmi Python kütüphanesidir. Önce kütüphaneyi kurun:

pip install ollama

Python kaynak kodu kod editorunde renkli sozdizimi vurgulama ile goruntuleniyor — Python kod editörü: Ollama Python kütüphanesiyle yerel modele programatik erişim (CC0, joncutrer/Flickr)

Kurulumdan sonra birkaç satır kodla yerel modelinize soru sorabilirsiniz. Aşağıdaki örnek, chat fonksiyonunu kullanarak modele bir mesaj gönderir:

import ollama
yanit = ollama.chat(model='llama3.2', messages=[{'role':'user','content':'Merhaba, nasılsın?'}])
print(yanit['message']['content'])

Uzun yanıtları kelime kelime ekrana akıtmak (streaming) isterseniz chat çağrısına stream=True parametresini ekleyip dönen yanıt üzerinde döngü kurmanız yeterlidir. Python ile yapay zekaya ilgi duyuyorsanız, yazılım öğrenmek için ücretsiz sertifikalı kurslar listemiz temel programlama becerinizi geliştirmenize yardımcı olur.

Ollama REST API Nasıl Çalışır?

Ollama, kurulduğu anda arka planda bir REST API sunucusu başlatır. Bu sunucu varsayılan olarak http://localhost:11434 adresinde çalışır. Yani Python dışında herhangi bir programlama dilinden veya doğrudan terminalden de modellerinize erişebilirsiniz.

En çok kullanılan uç noktalar (endpoint) şunlardır:

/api/generate — Tek seferlik metin üretimi.
/api/chat — Rol tabanlı sohbet (sistem/kullanıcı mesajları).
/api/tags — Yüklü modellerin listesi.

Örneğin terminalden basit bir istek göndermek için curl komutunu kullanabilirsiniz. Bu API sayesinde Ollama’yı kendi web siteniz, masaüstü uygulamanız veya otomasyon akışlarınızla birleştirmeniz mümkün hale gelir.

Arayüz (GUI) ile Kullanmak İsteyenler İçin Seçenekler

Komut satırı herkese hitap etmeyebilir. Eğer ChatGPT benzeri, fare ile tıklanan bir arayüz tercih ediyorsanız Ollama’nın üzerine çalışan grafik arayüzlerden (GUI) yararlanabilirsiniz.

Open WebUI tarayici arayuzu ile Ollama uzerinde yerel yapay zeka sohbet ekrani — Open WebUI: Ollama üzerinde tarayıcıdan ChatGPT benzeri yerel yapay zeka sohbeti (MIT lisansı, open-webui/open-webui)

En popüler seçenek, tarayıcı üzerinden çalışan ve sohbet geçmişi, model değiştirme gibi özellikler sunan Open WebUI‘dir. Bunun yanında masaüstü uygulamaları ve VS Code eklentileri de Ollama’yı görsel olarak kullanmanıza imkan tanır. Bu araçlar arka planda yine yukarıda anlattığımız REST API ile haberleşir; yani Ollama çalışırken siz sadece şık bir arayüz görürsünüz.

Görsel araçlarla yerel yapay zeka üretiminin sınırlarını merak ediyorsanız, düğüm tabanlı bir başka güçlü araç olan ComfyUI’nin nasıl kullanıldığını anlattığımız rehbere de göz atabilirsiniz.

Sık Karşılaşılan Sorunlar ve İpuçları

Ollama oldukça kararlı çalışsa da yeni başlayanların takıldığı birkaç nokta vardır. İşte pratik çözümler:

Model çok yavaş yanıt veriyor: Daha küçük bir modele geçin (örneğin 70B yerine 8B). Bellek yetersizse model diske taşar ve yavaşlar.
Bağlantı hatası alıyorum: API’nin çalıştığından emin olmak için ollama serve komutunu kontrol edin.
Disk doluyor: Modeller gigabaytlarca yer kaplar; kullanmadıklarınızı ollama rm ile silin.
Kendi asistanımı oluşturmak istiyorum: Bir Modelfile dosyasıyla sistem talimatı ve sıcaklık (temperature) gibi ayarları özelleştirebilirsiniz.

Yapay zekayı geliştirme süreçlerinize entegre etmek isteyen yazılımcılar için en iyi AI kod asistanları karşılaştırmamız da Ollama’yı tamamlayan güçlü bir kaynaktır.

Sonuç

Gördüğünüz gibi Ollama’nın nasıl kullanılacağı hiç de karmaşık değil. Tek bir kurulum, tek bir ollama run komutu ve birkaç dakika içinde kendi bilgisayarınızda çalışan, gizli ve ücretsiz bir yapay zeka asistanına sahip oluyorsunuz. Komut satırından Python’a, REST API’den grafik arayüzlere kadar her seviyeye uygun bir yol mutlaka var.

Eğer yerel yapay zeka modelleri ilginizi çekiyorsa, sitemizde yer alan “Yerel (Local) AI Modelleri Nelerdir? 2026’nın Öne Çıkan Modelleri” adlı yazımıza da göz atarak hangi modelle başlayacağınıza daha kolay karar verebilirsiniz.