Teknoloji

Çinli şirket DeepSeek, yapay zeka modeliyle ABD'nin teknolojideki hakimiyetine meydan okuyor

DeepSeek adlı şirketin düşük maliyetle ürettiği yapay zeka modeliyle, sektörde hakim olan büyük bütçeli ABD'li şirketlerin modellerinden üstün performans sergilemesi teknoloji dünyasında sarsıcı bir etki yarattı.

Çinli şirket DeepSeek, yapay zeka modeliyle ABD'nin teknolojideki hakimiyetine meydan okuyor
29-01-2025 12:22
Pekin

Düşük bir bütçe ve sınırlı bilgisayar gücüyle, açık kaynak kodlu bir Büyük Dil Modeli (LLM) geliştiren şirketin sektörün en büyük geliştiricileriyle "aşık atabilir" hale gelmesi, bu alanda milyarlarca dolar harcayan teknoloji şirketlerinin maliyetlerini sorgular hale getirirken, ABD borsalarında teknoloji hisselerinin değer kaybetmesine yol açtı.

ABD'nin ileri teknoloji çiplerin Çin'e ihracatını kontrol altına alarak ülkenin yapay zeka gibi çığır açıcı teknolojilerdeki gelişimine set çekmeye çalıştığı bir dönemde, Çinli bir şirketin kısıtlı olanaklarla ABD'deki muadilleri kadar verimli bir üretken yapay zeka aracı yaratabilmesi, teknoloji kısıtlamalarının etkinliğini de sorgulanır hale getirdi.

Kimileri, bu durumu ABD ile Sovyetler Birliği arasında İkinci Dünya Savaşı sonrasında uzay yarışını başlatan gelişme olarak görülen, Sovyetler'in 1957'de Sputnik uydusunu fırlatmasına benzeterek, bunun ABD ile Çin arasındaki rekabette yapay zeka alanında yarış başlatacak bir "Sputnik anı" olduğu yorumunda bulundu.

Açık kaynak kodlu ve ücretsiz olması sebebiyle hızla yayılarak popülerleşen modeli, ileri yapay zeka sistemlerinin demokratikleşmesi açısından olumlu bir gelişme olarak değerlendirilirken, bunu Çin'in ABD hakimiyetindeki sektörü baltalama girişimi olarak görenler de var.

V3: Düşük maliyetle üstün performans

DeepSeek'in teknoloji gündemine hızlı girişi, 26 Aralık 2024'te piyasa sürdüğü "DeepSeek V3" adlı modeli ile oldu. Çin'de yalnızca iki yıllık geçmişi olan bir start-up şirketi tarafından geliştirilen bu yapay zeka sohbet robotu, ABD'deki muadili modellerden daha iyi performans sergiledi.

Şirketin aynı gün açıkladığı teknik rapora göre, 671 milyar parametre içeren bu modelin eğitimi yalnızca 2 ay sürdü ve 5,58 milyon dolar gibi küçük bir bütçeyle gerçekleştirildi.

Modelin eğitiminde ABD'li çip üreticisi Nvidia'nın, Çin'e yönelik ihracat kısıtlamalarına uymak için tasarladığı daha düşük teknolojili H800 grafik işlemci üniteleri (GPU) kullanılırken 2,78 milyon GPU saatinde tamamlandı.

Facebook'un çatı şirketi Meta'nın geliştirdiği Llama 3.1 modelinin eğitilmesi, daha ileri teknolojili H100 çiplerin kullanılmasına rağmen 30,8 milyon GPU saati sürmüştü.

DeepSeek V3, yapılan testlerde metin anlama, alan uzmanlığı bilgisi, kodlama ve matematik problemlerini çözümü gibi yapay zeka kabiliyetlerinde büyük yatırımlarla geliştirilen Llama 3.1 ve Çinli teknoloji şirketi Alibaba'nın Qwen 2.5 gibi modellerinden daha iyi performans gösterdi.

Öte yandan aynı testlerde, Microsoft destekli OpenAI'ın GPT-4o ve Amazon destekli Anthropic'in Calude 3.5 Sonnet modellerine de eşdeğer sonuçlar elde edildi.

R1: Akıl yürütme modeli

DeepSeek, ABD Başkanı Donald Trump'ın yemin ederek göreve başladığı 20 Ocak'ta "R1" adını verdiği akıl yürütme modelini piyasaya sürdü.

"Akıl yürütme modeli" olarak adlandırılan bir yapay zeka fonksiyonu eklenen bu versiyon, sorulara yaklaşımını ve kendi akıl yürütme tarzını görüntüleyerek, daha fazla veriye gerek kalmadan kendini eğitebiliyor, bir uzmanın tabiriyle "sesli düşünebiliyor."

DeepSeek'in modeli yapay zeka dünyasında daha önce bilinmeyen yeni bir şey getirmese de OpenAI'ın benzer özellikteki ileri "o1" modelinden daha iyi performans sergilemesi, hala süren panik halini başlatan asıl gelişme oldu.

OpenAI'ın o1 entegre uygulaması 200 dolara satılırken, DeepSeek'in R1'inin bedava dağıtılması ve açık kaynak kodlu olması, yapay zeka alanında büyük yatırımlar yapan teknoloji şirketlerinin hisselerinin değer kaybetmesine yol açtı.

DeepSeek'in R1 akıl yürütme modeli, California Üniversitesi araştırmacılarının yapay zeka uygulamalarının performans bakımından derecelendirdikleri Chatbot Arena'da Google'ın Gemini ailesinden iki modelin ardından üçüncü sırada yer alırken, OpenAI'on o1 modelini geride bıraktı.

R1 modelinin entegre edildiği sohbet robotu, Apple'ın ABD uygulama mağazasında OpenAI'ın geliştirdiği sohbet robotu ChatGPT'den daha fazla indirilirken, aynı zamanda en fazla indirilen bedava uygulama oldu.

Borsa yatırımlarından büyük dil modeline

Çin'in doğusundaki Cıciang eyaletinin merkezi olan Hangcou şehrinde kurulan bir start-up şirketi olan DeepSeek, ilk yapay zeka modelini aynı yıl yayınladı.

Şirketin kurucusu Liang Vınfıng adında 40 yaşındaki genç bir bilgisayar mühendisi ve yatırımcı. Cıciang Üniversitesi'nde yapay zekanın temeli olan elektronik enformasyon ve bilgisayar görüşü eğitimi alan Liang, okulu bitirmesinin ardından sınıf arkadaşlarıyla "High Flyer" adlı yatırım fonu şirketini kurdu.

Şirket geliştirdiği "High-Flyer Quant" adlı modelle hisse senedi yatırımlarını otomatize ederek kısa zamanda portföyünü büyüttü. Liang ve ortakları yatırım fonundan sağladıkları kazancı, "Fire Flyer" adlı bir yapay zeka bilgisayar altyapısı kurmak için harcadı.

Liang, 2023 yılında Çin'e yayın yapan bir internet sitesine verdiği mülakatta, ABD'nin Çin'e ihracatına kısıtlama getirmesinden önce yapay zeka sistemlerinin eğitilmesinde kullanılan 10 bin adet Nvidai A100 çipi satın aldığını anlattı.

DeepSeek'in çıkışıyla kamuoyunun gündemine gelen Liang, üniversiteden ve yüksek lisanstan yeni mezun olan veya kariyerinin başlangıcından araştırmacı, mühendis ve uzman olanlarla çalışıyor.

Genç girişimci, Çin Başbakanı Li Çiang'ın martta Ulusal Kalk Kongresine sunacağı hükümetin çalışma raporu taslağı hakkında farklı kesimlerden temsilcilerin görüşleri almak üzere 20 Ocak'ta düzenlediği toplantıda yer aldı.

"Sputnik anı"

DeepSeek'in yapay zeka modelleri, bu alanda teknolojik ve ekonomik hakimiyeti elinde bulunduran, en büyük sermaye ve en ileri teknolojileri kullanan şirketlere sahip ABD'de şok etkisi yarattı.

ABD Başkanı Trump'a danışmanlık yapan teknoloji yatırımcısı Marc Andreessen, sosyal medya platformu X hesabındaki paylaşımında DeepSeek'in çıkışını, "yapay zekanın Sputnik anı" olarak niteledi.

Sovyetler Birliği'nin 1957 yılında Sputnik-1 uydusunu fırlatması, İkinci Dünya Savaşı'nın ardından başlayan Soğuk Savaş'ta ABD ile uzay yarışı için bir tetikleyici gelişme olmuştu. Sovyetler'in bir uyduyu yörüngeye fırlatabilecek kapasiteye sahip olduğunun anlaşılması, aynı zamanda nükleer başlık taşıyan kıtalar arası füzelerin ABD ana karasına ulaşabileceğinin bir kanıtıydı.

Çinli şirketin yapay zeka teknolojilerini geliştirmede ABD'li muadillerini kolaylıkla yakalaması, ABD'nin son yıllarda Çin ile jeopolitik rekabette bu ülkenin teknolojik gelişime set çekmeye yönelik stratejilerini boşa düşüren bir gelişme olarak değerlendiriliyor.

"Çip savaşı"

Washington yönetimi, son yıllarda teknoloji alanında daha sistemli, korumacı ve ulusal güvenliğe odaklı bir yaklaşıma yönelirken "yüksek çitli küçük bahçeler" olarak adlandırılan bir stratejiyle, ABD'nin ulusal güvenliğini tehdit edebilecek kilit teknolojilerin Çin gibi rakip ülkelere transferini önlemek üzere kısıtlayıcı ve korumacı tedbirler uyguluyor.

ABD'de 2022'de yürürlüğe giren Çip ve Bilim Yasası, Çinli üreticilerin ileri çip teknolojilerine erişimine getirdiği kısıtlamalarla Washington'ın, Çin'in bu sektördeki teknolojik kabiliyetine set çekme niyetini açıkça ortaya koydu.

Aynı yıl, aralarında Çin'in en büyük hafıza çipi üreticisi Yangzte Memory Technologies ve en büyük yarı iletken donanım üreticisi Naura Technology Group'un bulunduğu 31 şirket ve kurum, ABD'nin İhracat Kontrol Listesi'ne alındı.

Dönemin ABD Başkanı Joe Biden, 2023'te başkanlık kararnamesiyle, yarı iletkenler ve mikro-elektronik, kuantum bilgi teknolojileri ile yapay zeka sistemlerinin olduğu ABD'nin teknoloji alanındaki üç kritik şirkete Çin'de girişim sermayesi ve hisse ortaklığı yatırımları yapmasına kısıtlama getirdi.

Yeni göreve başlayan Başkan Trump da Çin'e yönelik ihracat kontrollerinin devam edeceği sinyalini verirken, DeepSeek'in başarısını "olumlu bir gelişme" olarak gördüğünü belirtti.

Miami'de Cumhuriyetçi Temsilciler Meclisi üyeleri ile buluşmasında, Çinli şirketin "çok fazla para harcamadan aynı sonuca ulaşılabildiğini gösterdiğine" dikkati çeken Trump, "Kazanmak için rekabet etmeye odaklanmamız gerektiği konusunda bizim endüstrilerimiz için bir uyandırma çağrısı olmalı." ifadelerini kullandı.

Kaynak: AA

dikGAZETE.com
SİZİN DÜŞÜNCELERİNİZ?
TÜRKİYE GÜNDEMİ
BUNLAR DA İLGİNİZİ ÇEKEBİLİR
ÇOK OKUNAN HABERLER