Bu madde henüz onaylanmamıştır.
+1 Daha
Yerel Dil Modelleri (Local LLM), internet bağlantısına ve merkezi bir bulut sunucusuna ihtiyaç duymadan, tamamen kullanıcının şahsi bilgisayarı veya yerel altyapısı üzerinde çalışan büyük ve küçük dil modellerini kapsayan yapay zeka teknolojileridir. Veri gizliliğini en üst düzeyde koruma, çevrimdışı (offline) çalışabilme ve bulut tabanlı API maliyetlerini ortadan kaldırma avantajlarıyla öne çıkan bu ekosistem, açık kaynaklı yapay zeka topluluklarının gelişmesiyle birlikte hızla yaygınlaşmıştır. Yerel dil modellerinin son kullanıcı cihazlarında yüksek performansla çalışabilmesi; optimize edilmiş dosya formatlarına, açık kaynaklı model mimarilerine ve bu modelleri bilgisayarda yürüten özel kullanıcı arayüzü yazılımlarına dayanmaktadır.
Yerel yapay zeka mimarisinin temelini, küresel teknoloji firmaları ve araştırma laboratuvarları tarafından parametre ağırlıkları açık olarak paylaşılan yapay zeka modelleri oluşturur. Geliştiriciler ve son kullanıcılar, bu açık kaynaklı modelleri Hugging Face gibi yapay zeka topluluk platformları üzerinden bilgisayarlarına indirerek özgürce özelleştirebilir ve çalıştırabilirler.
Yerel olarak çalıştırılmaya uygun, genel performans ve kodlama yetenekleri açısından öne çıkan başlıca büyük ve küçük dil modelleri şunlardır:

Görsel: Açık kaynaklı yapay zeka modellerinin (LLaMA, Qwen, DeepSeek), donanım optimizasyonu (GGUF kuantizasyonu, CPU/GPU katman paylaşımı) ve yerel araçlar (Ollama, LM Studio, AnythingLLM RAG) vasıtasıyla tamamen çevrimdışı (offline) çalışma mimarisi.
Açık kaynaklı yapay zeka modellerinin ham dosyalarını doğrudan bilgisayarda çalıştırmak teknik bir uzmanlık gerektirir. Bu süreci kolaylaştırmak ve modelleri son kullanıcının rahatça deneyimleyebileceği bir yapıya kavuşturmak amacıyla çeşitli yerel çalıştırma platformları ve arayüzler geliştirilmiştir.
Yerel olarak çalıştırılan dil modellerinin en verimli kullanım senaryolarından biri, Kaynak Destekli Üretim (RAG - Retrieval-Augmented Generation) sistemleridir. AnythingLLM, yerel RAG çözümleri için geliştirilmiş kapsamlı bir kullanıcı aracıdır. Bu yazılım; Ollama veya LM Studio üzerinden çalışan yerel dil modelini bir arayüzde birleştirir. Kullanıcılar kendi gizli belgelerini, kitaplarını veya kaynak kodlarını AnythingLLM içerisine yükleyerek verilerinin hiçbir şekilde dışarı sızmadığından emin oldukları tamamen yerel bir bilgi tabanı (knowledge base) oluşturabilirler.
Büyüklükleri yüzlerce gigabaytı bulabilen yapay zeka modellerinin şahsi bilgisayarların belleklerine sığabilmesi ve akıcı çalışabilmesi için dosya formatlarının optimize edilmesi gerekmektedir.
GGUF (GPT-Generated Unified Format), özellikle yerel bilgisayarlarda CPU ve GPU donanımlarının verimli bir şekilde paylaşılmasını sağlayan devrimsel bir model dosyası formatıdır. GGUF formatındaki modeller, bilgisayarların RAM ve ekran kartı (GPU) kapasitelerine göre esnek bir şekilde yüklenebilir. Eğer bir model bilgisayarın GPU belleğine tamamen sığmıyorsa, GGUF formatı sayesinde model katmanlarının bir kısmı GPU üzerinde, geri kalan kısmı ise sistem RAM'i üzerinde çalıştırılarak kısıtlı donanımlarda bile büyük dil modellerinin offline olarak yürütülmesi sağlanır.
Bai, Jinze, Shuai Bai, Yunfei Chu, Zeyu Cui, Kai Dang, Xiaodong Deng, Yang Fan, vd. "Qwen Technical Report." arXiv preprint arXiv:2309.16609 (2023).
Erişim tarihi: 23 Mayıs 2026.
Touvron, Hugo, Louis Martin, Kevin Stone, Peter Albert, Amjad Almahairi, Yasmine Babaei, Nikolay Bashlykov, vd. "Llama 2: Open Foundation and Fine-Tuned Chat Models." arXiv preprint arXiv:2307.09288 (2023).
Erişim tarihi: 23 Mayıs 2026.
Henüz Tartışma Girilmemiştir
"Yerel Dil Modelleri ve Çalıştırma Teknolojileri" maddesi için tartışma başlatın
Açık Kaynaklı Model Ekosistemi
Popüler Açık Kaynaklı Modeller
Yerel Model Çalıştırma ve Arayüz Araçları
Çalıştırma Motorları
Arayüz Entegrasyonu ve Yerel RAG Sistemleri
Model Formatları ve Sıkıştırma Teknolojileri
GGUF Formatı ve Donanım Optimizasyonu
Bu madde yapay zeka desteği ile üretilmiştir.