Истражувачите откопаа стотици илјади плочи клинесто писмо, но многу од нив останаа непреведени. Преведувањето на древни јазици е процес кој бара многу време, а само неколку стотици експерти се квалификувани да го изведат. Една неодамнешна студија опишува нова вештачка интелигенција (ВИ) која дава висококвалитетни преводи на антички текстови.
Преводот не е едноставно прашање на замена на еден збор за соодветен збор на друг јазик. Висококвалитетниот превод бара од преведувачот да разбере како двата јазика ги поврзуваат мислите и потоа да го искористи тоа знаење за да создаде превод што ги одржува лингвистичките нијанси на оригиналот, кој мајчин јазик го разбираат без напор.
Колку и да е тежок тој процес, тоа не е ништо во споредба со предизвикот да се преведе антички јазик на современ јазик. Овие преведувачи не само што треба да ги воскреснат изумрените јазици од пишани извори, туку и да имаат интимно знаење за тоа како културите што ги создале тие извори еволуирале низ вековите. Ако тоа не беше доволно, нивните извори често се фрагментирани, оставајќи го клучниот контекст изгубен со векови.
Поради ова, бројот на луѓе способни да преведуваат јазици од антиката е мал, а нивните најдобри напори честопати ги надминуваат обемот на текстови што ги откопале археолозите.
Земете антички акадски јазик. Овој ран семитски јазик е еден од најдобро потврдените од античкиот свет. Стотици илјади, според некои сметки и повеќе од милион, акадски текстови се откриени и денес лежат во музеи и универзитети. Многумина се дури и дигитализирани преку Интернет. Секој од нив има потенцијал да нè научи за животот, политиката и верувањата на првите цивилизации, но сепак ова знаење останува заклучено зад времето и работната сила потребни за нивно преведување.
За да помогне да се промени тоа, мултидисциплинарен тим од археолози и компјутерски научници разви вештачка интелигенција која може да го преведе акадскиот речиси веднаш и да го отклучи историскиот запис зачуван во овие табли стари 5.000 години.
Акадски изгубен (и пронајден)
Акадскиот бил мајчин јазик на Акадската империја, која настанала околу 2300 година п.н.е. преку освојувањата на нејзиниот основач Саргон Велики. Како говорен јазик, акадскиот на крајот ќе се подели на асирски и вавилонски дијалекти пред да биде целосно заменет од арамејскиот на почетокот на првиот милениум п.н.е. Денес, тој е навистина изумрен јазик, без дури ни јазици ќерки да го продолжат тоа наследство.
Како писмен јазик, сепак, акадскиот се покажал поиздржлив. Империјата го позајмила клинестото писмо на нејзиниот наследник, Сумерската цивилизација. Овој систем за пишување користел пенкало од трска за да ги вметне клиновите хиероглифи во влажни глинени плочи пред да ги испече (оттука и името клинесто писмо, што буквално значи „клин во облик“ на латински). Дури и откако арамејскиот го замени акадскиот како заеднички јазик во регионот, научниците продолжија да пишуваат на акадски, клинесто писмо до првиот век од нашата ера – дури и во антиката, се чини, научниците и академиците биле неверојатно тврдоглави.
Овој традиционален начин на размислување имаше ненамерна корист и за современите археолози. Додека клинестото писмо можело да се пишува на папирус, почесто се пишувало на глина или камен. Овие материјали многу подобро се спротивставуваат на пожарите и поплавите што ги опустошија нивните врсници. И додека времето е сурово кон сите нешта – археолозите ретко откриваат плочи со клинесто писмо во добра состојба – ова е една од причините зошто акадското писмо може да биде толку добро потврдено во историските записи.
„Иронично, деструктивните пожари ги зачуваа некои од најголемите библиотеки во античка Месопотамија – затоа што беа направени од глина. Спротивно на тоа, сите папирусни библиотеки во древниот Египет изгореле или се распаднале во прашина, иако преживеале многу поединечни кодекси“, пишува лингвистот Стивен Роџер Фишер во „Историја на пишувањето“.
Дури и со такво лингвистичко богатство, правилното преведување на овие древни библиотеки не е мала работа. Надвор од веќе споменатите предизвици, акадскиот јазик е поливалентен. Односно, неговите клинесто писмо може да имаат неколку различни читања во зависност од функцијата на реченицата. Постојат многу причини за овој развој, но според Фишер, една од причините зошто Акадците никогаш не ја поедноставиле е тоа што „изгледале дека се врзани за традицијата и самонаметнатата ефикасност“. Тој традиционален начин на размислување ги наведе да продолжат да го користат сумерското писмо за јазик многу различен од сумерскиот.
Како таков, преведувањето на акадски е процес во два чекора. Прво, научниците мора да ги транслитерираат знаците со клинесто писмо. Односно, тие го земаат клинестото писмо и го препишуваат користејќи ја фонетиката со сличен звук на целниот јазик. Пример со кој на повеќето читатели ќе им биде познат е арапскиот збор الله, кој на англиски се преведува како „Бог“, но се транслитерира како „Алах“. Оваа транслитерација е најблиската што латинската азбука може да ја добие до создавање на зборот како што звучи на арапски. Потоа, научниците ја земаат нивната транслитерација на текстот и ја преведуваат на современ јазик.
Вештачка интелигенција дава моментални резултати
Како што можете да замислите, тоа може да биде долг и макотрпен процес – процес кој бара години обука и посветеност за да научите да го правите добро. За да се забрзаат работите, истражувачкиот тим разви модел на невронски машински превод за акадски клинесто писмо, истата технологија што е и на Google Translate.
Тимот го обучуваше моделот на вештачка интелигенција на примерок од текстови со клинесто писмо од Open Richly Annotated Cuneiform Corpus и го научи да преведува на два различни начини. Прво, моделот со вештачка интелигенција научи да преведува акадски од транслитерации на оригиналните текстови. Исто така, научи како директно да ги преведува симболите со клинесто писмо. Поконкретно, тој ги преведе глифите на Уникод на клинесто писмо кои беа генерирани од друга алатка за заштеда на време која автоматски произведува Уникод од слика на оригинален таблет.
Моделот на вештачката интелигенција потоа мораше да открие како да се справи со нијансите на различните жанрови на примерокот – на пример, разликата помеѓу литературните дела и административните букви – како и како да се справи со промените пронајдени во клинестото писмо што се користеа во текот на милениумите. Моделот на вештачката интелигенција потоа беше тестиран со помош на двојазичното оценување 4 (BLEU4), алгоритам што се користи за проценка на текстот преведен од машина.
Во тестот за транслитерација на англиски јазик, моделот со вештачка интелигенција на тимот постигна 37,47 поени. Во тестот од клинесто писмо до англиски, тој доби 36,52 поени. Двата резултати беа над нивната целна основна линија и во опсегот на висококвалитетен превод. И имаше изненадувачки резултат: моделот можеше да ги репродуцира нијансите на жанрот на секоја тест реченица. Иако ова не беше една од целите на истражувачот, тие забележуваат во студијата дека тоа може да отвори можности за употреба надвор од преводот.
„Речиси во секој случај, без разлика дали [преводот] е правилен или не, жанрот е препознатлив“, пишува тимот. „Едно ветувачко идно сценарио би можело [моделот] да му покаже на корисникот листа на извори на кои тие ги засновале своите преводи, што исто така би било особено корисно за научни цели.
Тимот ги објави своите резултати во рецензираниот PNAS Nexus. Тие, исто така, го објавија своето истражување и изворниот код на GitHub во Akkademia.
Иднината на минатото изгледа посветла
Колку и да се ветувачки првичните резултати, има уште работа да се заврши. Во двата случаи, некои од тест речениците беа погрешно преведени. И како и другите модели со вештачка интелигенција, и овој е склон кон халуцинации – моменти кога одговорот нема врска со изворот.
Моделот со вештачка интелигенција најдобро функционира кога преведува реченици со кратка до средна должина. Исто така, подобро е со повеќе формулаични жанрови, како кралски декрети и административни записи, отколку литературни жанрови како што се митови, химни и пророштва. Со поголема обука за поголема база на податоци, истражувачите забележуваат во студијата, тие имаат за цел да ја подобрат неговата точност. Со текот на времето, тие се надеваат дека нивниот модел со вештачка интелигенција може да дејствува како виртуелен асистент на научниците. Вештачката интелигенција може брзо да обезбеди суров превод, додека научникот може да го усоврши со своето познавање на историските јазици, култури и луѓе.
„Стотици илјади глинени плочи испишани со клинесто писмо ја документираат политичката, социјалната, економската и научната историја на Месопотамија. Сепак, повеќето од овие документи остануваат непреведени и недостапни поради нивниот огромен број и ограничениот број на експерти кои можат да ги читаат“, пишува тимот во студијата.
„Ова е уште еден голем чекор кон зачувување и ширење на културното наследство на Месопотамија“.
Извор: Big Think
Подготви: Ј. Ѓ.