1. Haberler
  2. Teknoloji
  3. DeepSeek’ten yeni meydan okuma: Janus-Pro tanıtıldı

DeepSeek’ten yeni meydan okuma: Janus-Pro tanıtıldı

featured
Paylaş

Bu Yazıyı Paylaş

veya linki kopyala

Çinli DeepSeek, gelişmiş yapay zeka (AI) modellerinin bir anda tanınan hale gelmesi ile birlikte dikkatleri üzerine çekti. Şirket, AI modellerini eğitmek için sadece 6 milyon dolardan az bir bütçe harcadı. Buna karşılık, OpenAI’nin DALL-E 3 modeli için yatırılan ölçü 100 milyon dolar civarındaydı.

DeepSeek’in başarısı, yalnızca App Store’da bir numara olmasının ötesine geçmiş durumda; NVIDIA’nın ABD pazarında 400 milyar dolarlık paha kaybetmesine bile yol açan bir gelişmeden bahsediyoruz. Hal bu türlü olunca, hizmetin siber hücumlara uğraması ve kapasite meseleleri yaşaması da kaçınılmaz oldu.

Janus-Pro’nun Çığır Açan Başarısı

Bu zorlukların üstesinden gelmeye çalışan Çin merkezli AI laboratuvarı DeepSeek, tıpkı vakitte Janus-Pro isimli ihtilal niteliğinde bir açık kaynaklı metinden görsele AI modelini duyurdu. Bu yeni model, büyük bir yankı uyandırarak, manzara üretiminde OpenAI’nin DALL-E 3, Stability AI’nın Stable Diffusion ve başka emsal modellerden birkaç kriterde daha uygun performans sergiliyor.

  • Çin’in yapay zekası DeepSeek, aniden nasıl bu kadar tanınan oldu?

Janus-Pro, geçtiğimiz yıl sonlarına yanlışsız piyasaya sürülen Janus modelinin güncellenmiş sürümü. Janus-Pro, farklı boyutlarda sunuluyor; bunlar ortasında 1 milyar parametreden 7 milyar parametreye kadar değişen seçenekler bulunuyor. DeepSeek’in paylaştığı datalara nazaran, en büyük model olan Janus-Pro-7B, rakipleri PixArt-alpha, Emu3-Gen ve SDXL‘yi GenEval ve DPG-Bench üzere sanayi standartlarında geride bırakarak hem imaj üretimi hem de tahlilde kusursuz bir performans gösteriyor. Janus-Pro-7B, HuggingfaceAI platformu üzerinden fiyatsız olarak indirilebiliyor, bu platform ise makine tahsili alanında hayli tanınan.

Yeni Bir Yaklaşım: Görsel Kodlayıcı ve Esneklik

Janus-Pro-7B, birleşik bir transformatör mimarisini kullanarak görsel kodlama süreçlerini ayrıştıran bir otoregresif çerçeveye dayanıyor. Bu yaklaşım, sırf görsel kodlayıcının üretim ve anlayış rolü ortasındaki çatışmayı hafifletmekle kalmıyor, birebir vakitte modelin esnekliğini de artırıyor. Janus-Pro, tekil süreçler için özel olarak tasarlanmış modellerle karşılaştırıldığında, çoklu misyonlarda rakiplerini geride bırakıyor. Fakat, özel emelli modellerin sunduğu performansın da gölgesinde kalmıyor.

Rekabetçi Zorluk ve Uygulama Alanları

Janus-Pro’nun piyasaya sürülmesi, DeepSeek’in evvelki muvaffakiyetinin akabinde, GPT-4’e emsal özellikler sunan yeni R1 lisan modelinin de tesiriyle büyük bir rekabet doğurdu. Bu gelişmiş modellerin düşük maliyetle geliştirilmesi, ABD AI sanayisinde şok tesiri yaratmış durumda. Bu cins yeni modeller, bölümdeki klasik AI uygulamalarıyla kıyaslandığında daha uygun fiyatlarla büyük bir dönüşüm vaat ediyor.

DeepSeek’ten yeni meydan okuma: Janus-Pro tanıtıldı
Yorum Yap

Giriş Yap

Budun ayrıcalıklarından yararlanmak için hemen giriş yapın veya hesap oluşturun, üstelik tamamen ücretsiz!