Teknolojinin gelişmesi, çeviri sektörünü de etkilemiş ve yeni kavramlar ortaya çıkmıştır. Çeviri sektöründe ortaya çıkan bu kavramlardan biri de makine çevirisidir. Daha çok sayıda şirket, çeviri projelerine fayda sağlayabileceği için çeviri süreçlerinde makine çevirisi uygulamaya başladı. Peki, makine çevirisi tam olarak nedir ve hangi türler mevcuttur?
Salt makine çevirisi (MT: Machine Translation), kaynak dilden hedef dile aktarımın otomatik yazılımlar aracılığıyla gerçekleştiği ve insan müdahalesinin olmadığı çeviri sürecidir. Oxford sözlüğündeyse bu kavram, “bilgisayar tarafından yapılan çeviri” olarak tanımlanmıştır. Ancak artık makine-insan işbirliği ile makine çevirisi farklı bir boyuta taşınmıştır. Teknolojinin gelişmesiyle ortaya çıkan makine çevirisi kavramı, çeviri sektörünü etkilemiş ve çeviri sektörüne birçok fayda sağlamıştır.
Google Translate veya Yandex Translate gibi ücretsiz yazılımlar sunan web siteleri bütçesi olmayan şirketlerin çeviri yapmak için faydalandığı yerlerdir. Bu doğrultuda faaliyet gösteren web siteleri veya yazılımları kullanmak bazen iyi sonuç verse de insan tarafından yapılan çevirinin yerini tutmayacağı kabul edilen bir gerçektir. Öyle ki, çevirmen kontrolünden geçmeyerek yapılan makine çevirilerinde ciddi hatalar meydana gelebilir. Diğer taraftan, makine çevirisi bilgisayar destekli çeviriyle (CAT) karıştırılmamalıdır. Trados veya Smartcat gibi bu araçlar bir insan çevirmenin çeviri sürecine yardımcı olmak için üretilmiş bilgisayar yazılımları veya kodlardır; CAT araçları içeriği otomatik olarak çevirmez.
Makine çevirisi tanımı gereği, metni veya konuşmayı bir dilden diğerine çevirmek için yazılım kullanan bir bilgisayarlı dilbilim ve dil mühendisliği biçimidir. Temel olarak, makine çevirisi sürecinde kaynak dildeki bir kelime yerine hedef dildeki bir kelime geçer.
İçeriği farklı şekilde analiz eden ve işleyen birkaç makine çevirisi motorları vardır. En yaygın olanları kural tabanlı makine çevirisi ve istatistiksel makine çevirisidir.
Kural Tabanlı Makine Çevirisi (RBMT)
Kural tabanlı motorlar, içeriği analiz edip parçalarken sayısız dilbilgisi ve dil kuralları kullanır. Kurallar kullanılırken, kaynak dilin gramer yapısı hedef dile aktarılır. İki dilli sözlükler de dil çiftleri için kullanılır ve motorun performansını iyileştirmek için özelleştirilmiş terminoloji listeleri eklenebilir. Belirli bir konu veya sektöre belirli bir terminoloji ekleyerek, ilgili konu hakkında daha güvenilir bir çeviri sonucu oluşturulabilir. Kural tabanlı motorlar, bir çeviri sistemi oluşturmak için büyük ve yapılandırılmış metin kümeleri olarak da bilinen iki dilli külliyat gerektirmez.
Bu motorlar, çevirilerin dayandığı gramer kuralları ve sözlüklerin sayısı nedeniyle oldukça tahmin edilebilir ve çok tutarlı çıktılar üretir. Belirlenen kurallar sayesinde her hata bir hedef kuralla düzeltilebilir. Böylece, çeviriler daha fazla kural ve daha fazla sözlük veya terminoloji eklenerek geliştirilebilir.
İstatistiksel Makine Çevirisi (SMT)
RBMT’den farklı olarak, istatistiksel makine çevirisi metinleri dil kurallarına göre analiz etmez. Bunun yerine bu motor, metinlerin nasıl çevrileceğini “öğrenir”. Bu nedenle, dil çiftlerinde büyük miktarda veriyi analiz eder ve ardından kaynak içeriğin çevirisini oluşturmak için istatistiksel çeviri modellerini kullanır. Bu model, herhangi bir iki dildeki büyük metin kümeleri analiz edilerek oluşturulur . SMT ile, bir konuyla ilgili daha fazla veri toplanarak belirli bir konu veya sektöre de odaklanılabilir.
Makine Çevirisi ve Nöral Ağlar
Makine çevirisi gelişiyor. Yaklaşık 2013’ten beri, Google ve Microsoft gibi internet devleri nöral ağları kullanmanın yollarını araştırıp uygulamalar yapıyorlar. Nöral ağlar, ilk olarak konuşma ve görüntü tanıma teknolojisinde kullanılan istatistiksel öğrenme modelleridir. Bunları makine çevirisinde kullanmak, motorların desenler ve yapılar aracılığıyla insan beyninin çalışma şekline benzer bir süreç kullanarak metinleri nasıl çevirecekleri konusunda kendilerini eğitmelerini sağlar. Bu sürece “derin öğrenme” denir ve büyük veri analitiğinin uygulanmasıyla oluşturulan ilkelere dayanır.
Nöral makine çevirisi (NMT) yeni bir yaklaşım olmasına rağmen, büyük bir atılım olarak görülüyor ve çoğu durumda çeviriyi iyileştirdiği ve daha akıcı görünen bir çıktı sunarak MT araştırmacıları arasında çok popüler hale gelmiş durumda.
NMT’nin daha akıcı çeviriler oluşturduğu bazı dil çiftlerinde ham çeviri metin oluşturmak için gereken zamanı %25’e kadar azaltabildiği görülüyor. Bazı dilbilim uzmanları için, artık nöral makine çevirisinin kural tabanlı veya istatistiksel makine çevirisinden daha iyi performans gösterdiğine dair hiçbir şüphe yok. NMT sistemleri kelimelerin benzerliğini anlar ve görür, tüm cümleleri dikkate alır ve diller arasındaki karmaşık ilişkileri öğrenir (Kaynak: 3 Reasons Why Neural Translation is a Breakthrough).
Her motor verileri farklı şekilde işleyip ürettiği için bir projede seçilen motor, hedef dillere ve verilen kaynak dosyalar için referans materyallerinin bulunup bulunmamasına göre performans sergiler. Genel olarak, makine çevirisi aynı kelimelerin yeniden kullanıldığı ve eş anlamlıların en aza indirildiği tekrarlayan ve basit içerikle en iyi sonucu ortaya koyar. Makine çevirisinin avantajları hakkında hiç şüphe yok: üretkenliği artırıp pazara sunma süresini kısaltırken ve terminoloji tutarlılığını iyileştiriyorlar.
Avantajları ve Dezavantajları
Hızlı Çeviri: Bu çeviri türü hızlı şekilde çeviriyi yaparak zaman kazandırır. Bir metnin çevrilme işlemi saniyeler içinde gerçekleşebilir. Ancak, makine çevirisinin kaliteli olması açısından sonrasında çevirmenler tarafından kontrol edilmesi ve düzenlemeler yapılması oldukça önemlidir.
Düşük Maliyet: Daha önce de bahsettiğimiz gibi uzun soluklu projeler için birçok çevirmen çalışması gerekebilir. Ancak bu sürece makine algoritması eklendiğinde daha az çevirmen çalıştığından proje bazındaki maliyet de buna paralel olarak düşecektir.
Terim Yönetimi: Makine algoritmasında terimler bulundurur. Böylece terimlerle karşılaştığı her yerde aynı eşdeğerliliği kullanarak proje bazında tutarlılık sağlar.
Kullanım Alanları
Makine çevirisi kullanımı, teknolojinin içine doğmuş yeni nesil çevirmenler arasında oldukça yaygındır. Makine çevirisi uzun ve büyük projelerde çevirmenler için vazgeçilmez bir kaynaktır. Çok geniş içerikte olan bu projelerin zamanında ve uygun bütçeyle bitirilmesi makine çevirisiyle mümkün hale gelir. Uzman bir çevirmenin günlük ortalama 2000 kelime civarı çeviri yaptığı göz önüne alındığında milyonlarca kelime içeren projenin bir grup çevirmen tarafından çevrilmesi ve daha sonra düzeltme aşamasından geçip müşteriye ulaştırılması çok fazla zaman alabilir. Böyle bir durumda farklı çevirmenler tarafından gerçekleştiren projede tutarlılığı yakalamak da oldukça zor olacaktır. Bu anlamda makine ve algoritmalarla yapılan tercüme, sürecin hızlanmasını sağlar.
Makine çevirisi e-posta veya müşteri değerlendirmesi gibi kısa süreli okuma gerektiren metin türlerinde de kullanılabilir. Bu tür metinler, okuyucu tarafından hızlıca veya yalnızca bir kere okunduğundan yapılacak çevirinin üst düzey kalitede olması beklenemez. Bu anlamda makine çevirisinin kullanımında içerik türü de oldukça etkilidir. Örneğin, web sitesi çevirisi veya pazarlama çevirisi gibi hedef kültüre hitap etmesi gereken içeriklerde makine çevirisi kullanılmaz. Bu tür metinlerde makine çevirisiyle yapılması hedef kitle için bir anlam ifade etmeyebilir. Dolayısıyla, bu metinlerin çevirisi hedef kültürü iyi bilen uzman çevirmenler tarafından yapılmalıdır.