Yapay zekâ alanında büyük dil modellerinin eğitimi giderek daha karmaşık ve maliyetli bir hâl alırken, Çin merkezli DeepSeek şirketi bu süreci kökten değiştirebilecek bir yöntem geliştirdi. Şirket, geleneksel yaklaşım olan model büyüklüğünü artırma stratejisi yerine, modellerin kendi iç muhakeme sistemlerini devreye sokarak daha etkili sonuçlar elde ettiklerini savunuyor.
Ocak ayında R1 isimli yapay zekâ modelini tanıtan DeepSeek, bu modelin ChatGPT gibi popüler çözümlerle benzer doğruluk oranlarına ulaştığını, ancak bunu çok daha düşük kaynak tüketimiyle başardığını öne sürmüştü. Şirket, Tsinghua Üniversitesi ile birlikte yürüttüğü son çalışmasında bu başarının temelini oluşturan yeni yöntemi kamuoyuna duyurdu.
Geliştirilen yeni teknik, “kendi ilkelerine dayalı eleştiri ayarı” (self-principled critique tuning – SPCT) adını taşıyor. Bu yöntem sayesinde yapay zekâ, içerikleri değerlendirirken kendi belirlediği kuralları referans alarak geri bildirimler oluşturuyor. DeepSeek'in bu teknolojiyi entegre ettiği sistem ise “üretken ödül modellemesi” (generative reward modeling – GRM) olarak adlandırılıyor. GRM sistemi, verilen yanıtların hem teknik doğruluğunu hem de kullanıcı beklentilerine uyumunu ölçümleme yeteneğine sahip.
Sistemin dikkat çekici bir diğer yönü ise, daha fazla hesaplama gücü gerektiren devasa modellerin eğitimi yerine, aynı anda birden fazla iç değerlendirme yürüterek verimliliği artırması. Yapay zekâ, kullanıcıdan gelen her soruya, kendi iç yargıç modülünün yardımıyla hem kural temelli hem de örnek yanıt referanslı bir analiz uyguluyor. Bu çift yönlü denetim mekanizması, modelin zamanla daha iyi sonuçlar üretmesini sağlıyor.
Şirketin geliştirdiği bu yeni sistem “DeepSeek-GRM” adıyla anılıyor. Araştırmacılar, bu mimarinin Google’ın Gemini, Meta’nın Llama ve OpenAI’nin GPT-4o modellerinden daha iyi performans göstereceğine inanıyor. DeepSeek, geliştirdiği modelleri açık kaynaklı olarak paylaşmayı planladığını belirtse de, şu an için kesin bir tarih açıklanmış değil.
Öte yandan, yayımlanan bilimsel çalışmanın ardından şirketin R2 kod adlı yeni nesil sohbet robotunu tanıtmak üzere olduğu yönünde söylentiler de giderek artıyor. Ancak DeepSeek bu konuda resmî bir açıklamada bulunmadı.