“Doktora Düzeyinde” Yapay Zeka Nedir?

Yapay Zeka
01:55, Mar 10
Arda Kara
539 Okunma
0 Yorum

Silikon Vadisi, kusurlu sanal doktoralara üniversitelerin gerçek doktoralara verdiğinden daha fazla değer veriyor olabilir.

OpenAI'nin söylentilere göre 20.000 dolarlık ajan planı açıklandı.

YZ endüstrisinin yeni bir moda sözcüğü var: “Doktora düzeyinde yapay zeka”. The Information'da yer alan bir habere göre OpenAI, “doktora düzeyinde araştırmaları” desteklemeye odaklanan aylık 20.000 dolarlık bir katman da dahil olmak üzere çeşitli özel yapay zeka “aracı” ürünlerini piyasaya sürmeyi planlıyor olabilir. Planlanan diğer ajanlar arasında aylık 2.000 dolarlık bir “yüksek gelirli bilgi çalışanı” asistanı ve aylık 10.000 dolarlık bir yazılım geliştirici ajanı olduğu bildiriliyor.

OpenAI bu fiyatları henüz teyit etmedi, ancak daha önce doktora düzeyinde yapay zeka yeteneklerinden bahsetmişlerdi. Peki “doktora düzeyinde yapay zeka” tam olarak nedir? Bu terim, doktora düzeyinde uzmanlık gerektiren görevleri yerine getirdiği varsayılan modelleri ifade eder. Bunlar arasında ileri düzeyde araştırma yapan ajanlar, insan müdahalesi olmadan karmaşık kod yazma ve hata ayıklama ve kapsamlı raporlar oluşturmak için büyük veri kümelerini analiz etme yer alıyor. Temel iddia, bu modellerin genellikle yıllar süren uzman akademik eğitim gerektiren sorunların üstesinden gelebileceğidir.

OpenAI gibi şirketler “doktora seviyesi” iddialarını belirli kıyaslama testlerindeki performansa dayandırıyor. Örneğin, OpenAI'nin o1 serisi modellerinin bilim, kodlama ve matematik testlerinde iyi performans gösterdiği ve zorlu görevlerde insan doktora öğrencilerine benzer sonuçlar elde ettiği bildirildi. Şirketin alıntılarla araştırma makaleleri üretebilen Deep Research aracı, 100'den fazla konuda 3.000'den fazla soruyu kapsayan kapsamlı bir değerlendirme olan “Humanity's Last Exam ”da yüzde 26,6 puan aldı.

OpenAI'nin bu doğrultudaki en son ilerlemesi, Aralık ayında duyurulan o3 ve o3-mini modellerinden geliyor. Bu modeller geçen yılın başlarında piyasaya sürülen o1 ailesinin üzerine inşa edilmiştir. O1 gibi, o3 modelleri de OpenAI'nin “özel düşünce zinciri” adını verdiği, modelin dahili bir diyalog üzerinden çalıştığı ve nihai bir cevap sunmadan önce sorunlar üzerinde yinelemeli olarak çalıştığı simüle edilmiş bir akıl yürütme tekniğini kullanıyor.

Bu yaklaşım, görünüşte insan araştırmacıların anında cevaplar vermek yerine karmaşık sorunlar hakkında düşünmek için nasıl zaman harcadıklarını yansıtıyor. OpenAI'ye göre, bu çıkarım-zaman hesaplamasına ne kadar çok zaman ayırırsanız, o kadar iyi yanıtlar alırsınız. İşte kilit nokta: 20.000 $ karşılığında bir müşteri, yapay zeka modelinin zor problemler üzerinde çalışması için muhtemelen tonlarca düşünme süresi satın alıyor olacak.

OpenAI'ye göre o3, ARC-AGI görsel muhakeme ölçütünde rekor kırarak yüksek bilgisayarlı testlerde yüzde 87,5'e ulaştı ve yüzde 85'lik bir eşikte insan performansıyla karşılaştırılabilir. Model ayrıca 2024 American Invitational Mathematics Exam'da sadece bir soru kaçırarak yüzde 96,7 puan aldı ve lisansüstü düzeyde biyoloji, fizik ve kimya soruları içeren GPQA Diamond'da yüzde 87,7'ye ulaştı.

EpochAI tarafından yapılan Frontier Math kıyaslamasında, o3 problemlerin yüzde 25,2'sini çözerken, başka hiçbir model yüzde 2'yi aşmadı; bu da matematiksel muhakeme yeteneklerinde bir önceki modele göre bir sıçrama olduğunu gösteriyor.

Karşılaştırma ölçütleri ve gerçek dünya değeri

İdeal olarak, doktora düzeyinde gerçek bir yapay zeka modeli için potansiyel uygulamalar arasında tıbbi araştırma verilerinin analiz edilmesi, iklim modellemesinin desteklenmesi ve araştırma çalışmalarının rutin yönlerinin ele alınması yer alacaktır.

The Information tarafından bildirilen yüksek fiyat noktaları, eğer doğruysa, OpenAI'nin bu sistemlerin işletmelere önemli bir değer sağlayabileceğine inandığını göstermektedir. Yayın, bir OpenAI yatırımcısı olan SoftBank'ın OpenAI'nin aracı ürünleri için yalnızca bu yıl 3 milyar dolar harcamayı taahhüt ettiğini belirtiyor ki bu da maliyetlere rağmen iş dünyasının önemli bir ilgisinin olduğunu gösteriyor.

Bu arada OpenAI, prim fiyatlandırma stratejisini etkileyebilecek mali baskılarla karşı karşıya. Şirketin geçen yıl operasyonel maliyetleri ve hizmetlerini yürütmekle ilgili diğer masrafları karşılamak için yaklaşık 5 milyar dolar kaybettiği bildirildi.

OpenAI'nin stratosferik fiyatlandırma planlarına ilişkin haberler, kullanıcıları nispeten düşük maliyetlerle güçlü yetenekler beklemeye koşullandıran nispeten uygun fiyatlı yapay zeka hizmetlerinden yıllar sonra geldi. ChatGPT Plus aylık 20 dolar ve Claude Pro aylık 30 dolar - her ikisi de önerilen bu kurumsal katmanların çok küçük bir kısmı. ChatGPT Pro'nun aylık 200 dolarlık aboneliği bile önerilen yeni ücretlerle karşılaştırıldığında nispeten küçük kalıyor. Bu kademeler arasındaki performans farkının binlerce kat fiyat farkıyla eşleşip eşleşmeyeceği açık bir sorudur.

Karşılaştırmalı performanslarına rağmen, bu simüle edilmiş akıl yürütme modelleri hala konfabülasyonlarla (kulağa makul gelen ancak gerçekte yanlış bilgiler ürettikleri durumlar) mücadele etmektedir. Bu durum, doğruluk ve güvenilirliğin çok önemli olduğu araştırma uygulamaları için kritik bir endişe kaynağı olmaya devam etmektedir. Aylık 20.000 dolarlık bir yatırım, kuruluşların bu sistemlerin yüksek riskli araştırmalara ince hatalar katmayacağına güvenip güvenemeyecekleri konusunda soru işaretleri yaratıyor.

Haber üzerine sosyal medyada birkaç kişi, şirketlerin çok daha ucuza gerçek bir doktora öğrencisi kiralayabileceklerini söyledi. xAI geliştiricisi Hieu Pham viral bir tweet'te “Unuttuysanız söyleyeyim,” diye yazdı, “mevcut LLM'lerden çok daha iyi iş çıkarabilecek en parlak yıldızlar da dahil olmak üzere çoğu doktora öğrencisine ayda 20 bin dolar ödenmiyor.”

Bu sistemler belirli ölçütlerde güçlü yetenekler gösterse de, “doktora düzeyinde” etiketi büyük ölçüde bir pazarlama terimi olarak kalmaktadır. Bu modeller bilgiyi etkileyici hızlarda işleyebiliyor ve sentezleyebiliyor, ancak gerçek doktora düzeyindeki çalışmayı tanımlayan yaratıcı düşünme, entelektüel şüphecilik ve orijinal araştırmayı ne kadar etkili bir şekilde ele alabilecekleri konusunda sorular devam ediyor. Öte yandan, hiçbir zaman yorulmayacak veya sağlık sigortasına ihtiyaç duymayacaklar ve muhtemelen zaman içinde yeteneklerini geliştirmeye ve maliyetlerini düşürmeye devam edecekler.

0 Yorum