Teknopark'ın Kandilli Kampüsü'nde AR-GE firması olarak çalışmalarını yürüten Aicoor Bilgi Teknolojileri firması, küresel iletişimi kolaylaştırma misyonu doğrultusunda Türkiye'ye yerli bir çeviri platformu kazandırmak amacıyla Transleyt Projesi'ni hayata geçirdi.
Yapay zeka destekli yerli çeviri platformu olarak kullanıma açılan Transleyt, metin, doküman ve resim formatlı içerikleri ton, üslup ve alan gibi hassas ayarları seçme imkanı sunarak 30 dilde çapraz çeviri yapıyor.
Bu diller Türkçe, Osmanlı Türkçesi, İngilizce, Arapça, Bengalce, Çince (basitleştirilmiş), Çince (geleneksel), Danca, Flemenkçe, Fince, Fransızca, Almanca, Yunanca, Hintçe, Macarca, Endonezce, İtalyanca, Japonca, Korece, Malayca, Norveççe, Lehçe, Portekizce, Rusça, İspanyolca, İsveççe, Tagalogca (Filipino), Tayca, Ukraynaca ve Vietnamca.
Çevirinin yanı sıra ses dosyalarının deşifresini ve istenilen dile çevirisini de yapan platform, taranmış PDF dosyalarını OCR teknolojisiyle aranabilir hale getiriyor.
Platform ayrıca manzum ve düz yazı olan eski Türkçe metinlerin transkripsiyonunu yaparak 13. yüzyıldan 21. yüzyıla kadar farklı dönemlere göre dili sadeleştirebiliyor.
"Tüm yapay zeka modellerinin önemli olan 4-5'iyle birlikte işlem yapıyoruz"
Transleyt'in kurucusu girişimci Sadi Özgür, AA muhabirine yaptığı açıklamada, 5-6 yıldır Osmanlı Türkçesi dokümanların transliterasyonu ve transkripsiyonu üzerine çalışmalar yaptıklarını ancak bu metinlerin bugünün Türkçesine de çevrilebilmesi gerektiğini söyledi.
Elde ettikleri veri setleriyle "Transleyt" projesini, özellikle dil ve kültür hazinesi için önemli bir adım olarak hayata geçirdiklerini ifade eden Özgür, platformun toplamda 30 dilde çapraz çeviri yapabildiğini belirtti.
Projeyi geliştirirken genelde veri seti oluşturmakta zorluk çektiklerini aktaran Özgür, "Yaklaşık 1-1,5 yıldır bunun üzerine oluşturduğumuz data setleriyle uğraşıyoruz ve doğru neticeleri almaya başladık. Şu anda çıkan tüm yapay zeka modellerinin önemli olan 4-5'iyle birlikte arka planda işlem yapıyoruz." diye konuştu.
"15 ya da 14'üncü yüzyılda yazılmış bir metni güncel Türkçeye göre sadeleştirebiliyoruz"
Özgür, bu uygulamayı kullananlar araştırmacı, akademisyen ya da öğrenciyse, elinde bulunan Osmanlı Türkçesi ile yazılmış metinleri bugünün Türkçesine çevirmek istiyorsa bu sistemin yararlı olacağını belirterek, "Sadece Türkiye'deki akademisyenler için düşünmedik. Biz Osmanlı Türkçesinden 30 dile direkt çeviri yapabiliyoruz. Dolayısıyla kullanıcı Amerika'daki bir akademisyen, İngiltere'deki bir profesör ya da Almanya'da yaşayan bir öğrenci de olabilir. Elinde bulunan bir dokümanın görüntüsünü sisteme yükleyerek direkt resimden metne dilediği hedef diline çevirisini yapmış olacak." ifadelerini kullandı.
Platformun ses ve doküman çeviri ile transkripsiyon ve sadeleştirme yapmak gibi özellikleri de olduğuna değinen Özgür, "15 ya da 14'üncü yüzyılda yazılmış bir metni güncel Türkçeye göre de sadeleştirebiliyoruz. Güzel tarafı bu. Bire bir çeviriden ziyade sadeleştirebiliyoruz. Günümüz kullanıcısının da anlayabileceği bir dile çevirebiliyoruz." dedi.
Yazılım ekibinin Osmanlı Türkçesine hakim olduğunu ve karşılaştıkları problemler için kendi alternatif algoritmalarını geliştirdiklerini belirten Özgür, "Şu anda matbu metinlerde yüzde 98, düzgün el yazma metinlerde yüzde 92 gibi bir başarı elde edebiliyoruz. Zamanla yazma eserlerde de çok daha başarılı bir seviyeye geleceğimizi düşünüyorum ki zaten bu işin temel noktası yüzde 94'ü yakalamak." değerlendirmesini yaptı.
Google Translate, DeepL gibi ürünlerin yerlisini üretmeye çalıştıklarının altını çizen Özgür, konuşmasını şöyle sürdürdü:
"Temel özellik, Türkçeye çeviri anlamında bağlama, kontekste duyarlı çeviri olacaktır. Diğerlerinden ayrı özelliği, kullanıcı üslup, ton ve alan diye 3 farklı seçenekle çeviri yapabiliyor. Örneğin, hukuk alanında bir makale için tonunu 'akademik' seçip, alanını 'hukuk' seçtiğinizde sistem var olan hukuk terminolojisini dikkate alarak çeviriyi yapıyor. Veya tıp alanında bir makale var, böyle bir çeviri yapacağınızda bu sefer tıp dilini, sağlık terminolojisini dikkate alarak çeviriyi yapmış oluyor. Türkçeye çeviri noktasında özellikle bu bilinen firmalardan başarılı olduğumuzu görüyoruz."
Akademik camiada bu platformun daha çok kullanılacağını düşündüklerini dile getiren Özgür, dublaj, seslendirme gibi sisteme ek özellikler getireceklerini kaydetti.
"İç pazara hakim olduktan sonra globale açılma fikrimiz var"
Platformda dünyada en çok kullanılan dilleri öncelikli olarak seçtiklerini vurgulayan Özgür, "İngilizce, Almanca, Çince, Japonca, Hintçe, Rusça, Arapça ve Farsça gibi çok kullanıcılı olan dillere öncelikli olarak başladık. Öyle zannediyorum ki dünyada 8 milyar insan varsa 6 milyarı bu 30 dili kullanıyor. Dünya üzerinde konuşulan yüzde 80'e yakın dilleri kapsadığını söyleyebilirim." şeklinde konuştu.
İlk defa bu alanda yerli ve milli ürün çıkardıklarını ifade eden Özgür, şu görüşlerini paylaştı:
"Öncelikle iç pazarda hakimiyeti sağlamak istiyoruz. Google Translate ücretsiz, elbette onunla rekabet etme gibi bir hedefimiz yok. Bunun haricinde bizim yaptığımız gibi ücretli yapıp bağlama duyarlı çevirilerde yüksek performans gösteren firmalar, şu an Türkiye'de de 1-2 yıldır Türkçeyi de sistemlerine eklediler. Dolayısıyla bunlar pazarda belki yer edene kadar biz de onlardan önce iç pazara hakim olmak istiyoruz. Buraya hakim olduktan sonra yurt dışında nasıl rekabet edebiliriz, bunun yöntemleri için uğraşacağız. Akademi camiasından, yurt dışından, üniversitelerden de talep olacağını düşünüyorum. Yurt dışında üniversitelere kurumsal anlamda ulaşımımız kolay olacaktır. Bireysel anlamda da daha sonraki hedeflerde muhakkak globale açılma fikrimiz var."
Boğaziçi Üniversitesi Teknopark Genel Müdürü Cem Duran ise firmanın 6 ila 8 aylık bir süreçte projeyi geliştirerek pazara sunduğunu, üniversitenin de ilerleyen süreçte firmanın bir müşterisi olarak bu platformu öğrencilerin ve akademisyenlerin kullanımına açacağını söyledi.