Çin’in yapay zekası DeepSeek, apansızın nasıl bu kadar tanınan oldu?

cinin-yapay-zekasi-deepseek-apansizin-nasil-bu-kadar-taninan-oldu-pn34ADG9.jpg

OpenAI, geçtiğimiz hafta ChatGPT için Operator AI aracısını yayınlayarak en azından demolar kelam konusu olduğunda Google üzere rakiplerine nazaran çok önde olduğunu gösterdi. Lakin dünyayı sarsan AI haberi ChatGPT, Operator yahut geçen hafta duyurulan devasa Stargate projesi değildi. DeepSeek AI, Çinli bir teşebbüsün OpenAI’nin ChatGPT o1’ine rakip olan R1 akıl yürütme modelini yayınlamasıyla AI dünyasında büyük dalgalar yarattı.

DeepSeek’i farklı kılan ne?

OpenAI o3’ü duyurmuşken öteki AI şirketlerinin o1’e rakip sistemler oluşturması zati beklenen bir şey olduğu için bu kısımda şaşırtan bir durum yok. Lakin DeepSeek’in sıra dışı yanı, Çinli şirketin modellerini açık kaynaklı hale getirerek rastgele bir şirket yahut geliştirici tarafından erişebilir ve incelenebilir kılmasıydı. Daha da ilgi cazibeli olan kısım ise, DeepSeek’in yayınladığı, son derece gelişmiş modelin OpenAI’nin o1’inin maliyetinin çok daha az bir kısmına eğitildiğini tez eden R1 araştırma makalesiydi.

DeepSeek R1 eğitiminin, OpenAI’ın ChatGPT ile misal ilerleme için muhtaçlık duyduğu kaynakların sadece %3 ila %5’iyle mümkün olduğu haberi dünya çapında yankı uyandırdı. Pazartesi günü erken süreçlerde yapay zeka ile ilgili pay senetleri düştü, DeepSeek ise App Store’da ChatGPT’yi geride bırakarak 1 numaraya yükseldi.

Mevcut AI yazılımlarındaki meselelerden biri, eseri geliştirme ve kullanma maliyetiyle ilgili. o1 üzere gelişmiş modellerin geliştirilmesi onlarca milyon dolara mal olabilir. Süreç, gerekli bilgi süreç gücünü ve güç harcamalarını sağlayan üst seviye grafik kartları (GPU) gerektirir.

Bu yüzden ChatGPT o1 üzere bitmiş eserler sınırlamalar olmadan fiyatsız olarak sunulamıyor. OpenAI üzere şirketlerin maliyetleri karşılaması ve kar elde etmesi gerekir. Bu yüzden 500 milyar dolarlık devasa Stargate programı, bilhassa ABD ile Çin ortasındaki kaçınılmaz AI silahlanma yarışı düşünüldüğünde, AI geliştirme için çok kıymetli bir karar.

ABD’nin Çin’e karşı uyguladığı ambargoya karşın…

Çin’in, ChatGPT o1 eserlerinin geliştirilmesini mümkün kılan birebir üst seviye çiplere ve GPU’lara erişimini engelleyen ABD yaptırımları da düşünüldüğünde, ChatGPT, Gemini, Meta AI ve Claude’un Çin’den değerli bir rekabetle karşılaşmaması beklenebilirdi.

DeepSeek’in bu kadar şaşırtan olmasının bir sebebi de buydu. Çinli teşebbüs, yalnızca donanım gücüne güvenerek OpenAI ile rekabet edemeyeceğini biliyordu. OpenAI üzere şirketlerin elinde tuttuğu sayıda GPU’ya erişemezdi. Bu nedenle, DeepSeek araştırmacıları R1 için farklı bir yaklaşım benimsedi ve birebir donanıma erişim olmadan gelişmiş bir mantık modeli eğitmenin yollarını buldu.

Ayrıca DeepSeek, R1’e erişimi OpenAI’nin ChatGPT’sinden çok daha ucuz hale getirdi. Bütün bunlara DeepSeek modellerinin açık kaynaklı tabiatını da eklerseniz, neden geliştiricilerin Çinli firmanın AI’sını test etmek için akın ettiğini ve DeepSeek’in App Store’da neden yükseldiğini kestirim etmek çok güç olmuyor.

Bir araştırmaya nazaran, Çinli teşebbüs, daha süratli ve daha ucuz sonuçlar üretmek için OpenAI’nin ChatGPT’yi eğitmek için kullandığı Gözetimli İnce Ayar (SFT) teknolojisi yerine Destekli Öğrenme (RL) kullandı. SFT, AI’ye çeşitli komutlara ne cins cevaplar vereceğini bilmesi için bilgilere erişim sağlayarak meseleleri çözmenin yollarını göstermeye dayanıyor. RL ise, AI modeline güvenir, ödül sistemiyle karşılıkları bulmaya çalışır ve akabinde AI’ya geri bildirim sağlar.

RL, DeepSeek’in R1’in muhakeme yeteneklerini geliştirmesine ve hesaplama eksikliğinin üstesinden gelmesine imkan sağladı. Fakat, VentureBeat’in belirttiği üzere, RL’ye geçmeden evvel R1’in erken etaplarında insanların AI’yı denetledikleri kimi SFT eğitimleri gerekliydi.

Sadece 50.000 Nvidia GPU ile gelen başarı

DeepSeek’in bu başarıyı, ABD yaptırımlarından evvel alınmış olan 50.000 Nvidia GPU ile başarmış olması, çok daha yeni 500000’den fazla GPU ile çalışan OpenAI, Google ve Anthropic üzere Batılı firmaların benzeri metotlar kullanarak yapabileceklerinin sorgulanmasına yol açıyor. DeepSeek’in Çin merkezli olması kimi kuruluşlar ve bireyler için bir tasa sebebi olacak olsa da, pek çok kişi bu daha ucuz hizmeti tercih edecektir. Bu yüzden batılı AI şirketlerinin de artık maliyetlerini azalmaları mecburî olabilir ve AI alanında yakında çok daha fazla atılım görebiliriz.

Exit mobile version