?>

Yapay zekanın Türkçesini geliştirecek ve Türk gibi düşünmesini sağlayacak dil modeli geliyor

Türkiye, yapay zekanın oluşturabileceği riskleri önlemek amacıyla çalışmalarını yoğunlaştırırken TÜBİTAK tarafından geliştirilmeye başlanan "büyük dil modeli", bu teknolojinin Türkçesini geliştirmesine ve bir Türk gibi düşünmesine katkı sağlayacak.

Teknoloji - 7 ay önce

Ankara

AA'nın, "Yapay Zeka Çağına Doğru" başlıklı dosyasının ikinci haberinde, Sanayi ve Teknoloji Bakanlığının ilgili kuruluşu TÜBİTAK’ın yapay zeka teknolojisine yönelik çalışmalarına yer verildi.

Cezeri yolu açtı, yapay zeka hayatı akıllandırdı

Yapay zekanın gelişimi ve yayılması, diğer teknolojik ilerlemeleri geride bırakarak özellikle üretken yapay zeka ve büyük dil modelleri gibi alanları içine alarak bugüne kadar görülmemiş bir hızla ilerlemeye başladı.

Bu durumun, mevcut paradigmalara ve çözümlere büyük etki yapacağı ve geleneksel yapay zeka çözümlerinin etkinliğini azaltarak bu alanda çözümler sunan teknoloji sağlayıcılarının rekabet gücünü zayıflatacağı öngörülüyor.

Dünyadaki büyük teknoloji firmalarının geliştirdiği çözümlerle tekelleşmesi ve bu alanda diğer ülkeleri bağımlı hale getirmesi ihtimaline karşı ise üretken yapay zekanın Türkiye'de etkin kullanılması, bu teknolojileri geliştiren ve alanında yurt dışı bağımsızlığı kazanmış bir ekosisteme sahip olunması, Milli Teknoloji Hamlesi açısından kritik önem taşıyor.

Yapay zekada Türkçe kaynak sınırlı

Yapay zekanın kullandığı kaynak dil, kültürel etki bakımından da hayati önem taşıyor. Dil modellerinin önyargıları içerebilmesi ve bu modeller aracılığıyla kültüre yabancı önyargılar girebilmesi riski, bu teknolojiye yönelik çalışmaların önemini artırıyor.

Dünyada yaygın şekilde kullanılan büyük dil modelleri eğitilirken Türkçeye yeterince yer verilmemesi önemli risklerden biri olarak görülüyor. Meta'nın modelinde ilk 16 dil içinde Türkçe kendine yer bulamazken OpenAI modelinin eğitiminde Türkçe kaynaklar yalnızca yüzde 0,16 oranında kullanılıyor.

Chat GPT'de yazılan kodların yoğunlukla Anglo-Sakson dillerinden gelmesi, yapay zekanın verdiği yanıtlar ve sağladığı bilgilerde bu kültürün dünya görüşünün kullanıcılara sunulması dikkati çekiyor.

Dolayısıyla çocukların bu dil modelleriyle etkileşim kurması, Türk kültür, örf, adetlerinde yer almayan birçok unsurla tanışıp kültürel yozlaşmanın bir parçası olması riskini barındırıyor.

TÜBİTAK'ın modeli yapay zekanın dağarcığını geliştirecek

Bu noktada TÜBİTAK BİLGEM tarafından çalışmaları yapılan "Türkçe Büyük Dil Modeli" stratejik önem taşıyor. Kurum, bu alanda "temel model" geliştiren ilk ve tek kurum olarak diğerlerinden ayrışıyor.

Böylece, Türkçeyi iyi konuşmasının yanı sıra Türk kültürünü ve hassasiyetlerini de taşıyan bir model kullanıma hazırlanıyor.

Temel model, yapay zeka alanında, geniş bir veri seti üzerinde önceden eğitilmiş ve genel dil yapısını, sözcüklerin ve cümlelerin nasıl kullanıldığını öğrenmiş bir model olarak tanımlanıyor.

Bu model, belirli bir dilin veya birden fazla dilin geniş bir kapsamını içeren verilerle eğitiliyor. Örneğin, bir Türkçe temel model, internette bulunan Türkçe metinler, kitaplar, makaleler ve daha fazlasını içeren verilerle eğitilebilirken bu eğitim sürecinde model, dilin temel kurallarını ve dil bilgisini öğrenerek, kelime dağarcığını zenginleştiriyor.

"Türkçe Büyük Dil Modeli" sayesinde, Türk örf ve adetlerini de içeren Türkçe verilerle zenginleştirilecek yapay zeka, Türkiye'nin hassasiyetlerine hakim olacak, yeni teknolojiler ve uygulamalarla genç nesilde oluşabilecek kültürel yozlaşmanın önüne geçilmesine katkı sağlayacak.

Türkçeye özgü "tokenizer" geliştirildi

Türkçe büyük dil modelinin geliştirilmesi için internet ve dijital kaynaklardan toplanan Türkçe metinlerle bir veri havuzu oluşturma çalışmaları devam ediyor.

Bu proje kapsamında açık kaynaklı büyük dil modelleri üzerinde çalışmalar yapılıyor. Kaliteli bir Türkçe dil modeli oluşturmak için Türkçe'nin inceliklerini göz önünde bulunduran bir ön işleme aşaması geçirildi ve uygun derin öğrenme mimarisi seçildi.

Ayrıca, Türkçeye özgü bir "tokenizer" geliştirilerek, bu açık kaynaklı büyük dil modellerinin Türkçede etkin şekilde kullanılması sağlandı. Bu mimarinin parametre sayısı ve kullanılacak veriye oranı belirlendikten sonra model eğitimine başlandı.

Çalışmalar kapsamında eğitim süreci yakından takip edilirken, modelin farklı doğal dil işleme alanlarında (soru/cevap, özetleme, dil üretme, metin sınıflandırma gibi) farklı başarı metrikleriyle değerlendirilerek en iyi haline getirilmesi üzerinde duruluyor.

Atılan adımlarla Türkçesi gelişmiş, Türkiye'nin hassasiyetlerine hakim yapay zekanın, genç nesilde oluşabilecek kültürel yozlaşmanın önüne geçilmesine de katkı sağlaması hedefleniyor.

Kaynak: AA

dikGAZETE.com
Haftanın Öne Çıkanları

Meta yeni nesil yapay zeka çipini tanıttı

2024-04-10 19:27 - Medya

Cumhurbaşkanı Erdoğan: 45 bin tonu aşan yardım malzemesiyle Filistin halkının yanında olduğumuzu gösterdik

2024-04-09 18:18 - Siyaset

İllere göre bayram namazı saatleri

2024-04-08 09:33 - İslam-Hayat - Cemâziyelevvel 1446

Dünyada sağlık hizmetlerine erişimde Avrupa birinci, Afrika sonuncu sırada yer alıyor

2024-04-05 11:17 - Sağlık

Balkanlar'ı buluşturan Selimiye Meydanı'ndaki iftara 5 bin kişi katıldı

2024-04-04 22:27 - İslam-Hayat - Cemâziyelevvel 1446

Bakan Yerlikaya'dan İstanbul'da İsrail'i protesto sonrası çıkan olaylara ilişkin açıklama

2024-04-06 22:38 - Gündem

Trabzon'da engelliler için açılan diş sağlığı merkezi çevre illere de hizmet veriyor

2024-04-10 14:32 - Sağlık

2024 yılının ilk Güneş tutulması gerçekleşti

2024-04-08 23:52 - Magazin

Başkortostan ile Türkiye arasındaki dış ticaret hacmi yüzde 83,6 arttı

2024-04-06 23:38 - Özel Haber

Kadir Gecesi dualarla idrak edildi

2024-04-05 22:08 - İslam-Hayat - Cemâziyelevvel 1446

İlgili Haberler

Amazon, yapay zeka şirketi Anthropic'e 4 milyar dolar daha yatırım yapacak

18:37 - Teknoloji

Erciyes Üniversitesinde düşük voltajlı radyasyon dedektörü üretildi

12:53 - Teknoloji

Samanyolu dışındaki bir galakside ilk kez bir yıldızın yakınlaştırılmış görüntüsü yakalandı

11:52 - Teknoloji

TeknOn ile teknolojide bu hafta (15 – 21 Kasım 2024)

18:13 - Teknoloji

Türkiye'nin ilk kuantum bilgisayarı "QuanT" tanıtıldı

15:23 - Teknoloji

Günün Manşetleri

"Analogdan Dijitale Fotoğrafın Yolculuğu Sempozyumu" düzenlendi

23:57 - Gündem

Gaziantep FK, RAMS Başakşehir'i konuk edecek

23:27 - Spor

Eyüpspor, Süper Lig'in 13. haftasında Çaykur Rizespor'u konuk edecek

23:22 - Spor

Dışişleri Bakanlığı Sözcüsü Keçeli'den, Kerkük'teki nüfus hareketliliğine ilişkin açıklama

23:12 - Gündem

Bolu-Yedigöller yolu kar ve buzlanma riski nedeniyle kapatıldı

23:03 - Gündem