Со помош на напредни voice-cloning техники, тимот на Tytl успеа да го реконструира автентичниот глас на легендарната радио и телевизиска водителка Бранка Станковска. Вештачката реконструкција е создадена врз основа на специјален аудио-датасет креиран за време на развојот на платформата, a резултатот е дигитална гласовна реплика што ја задржува препознатливата дикција, боја и емоционален израз на водителката.
Најголемиот предизвик, како што велат од валандовскиот стартап, било создавањето на чист аудио-материјал погоден за тренирање на моделот. Повеќето достапни снимки биле од документарни емисии од архивата на МРТВ, каде гласот на Бранка бил мешан со музика, амбиентални звуци и други гласови. Тимот користел напредни open-source решенија и AI технологии за вокално разделување и подобрување на квалитетот, процес што траел долго и напредувал паралелно со развојот на самите алатки и технологии.
Процесот започнал уште во 2023-та година и постепено напредувал до сè поавтентична реконструкција на гласот на Бранка. Финалниот модел е трениран да ги задржи нијансите што ја прават веднаш препознатлива, од нејзината топлина во поздравите до динамичната интонација кај кулминациите на приказните.
Столе Китановиќ, ко-основач на Tytl, истакнува дека овој проект не е само технолошки исчекор, туку и важен чекор кон зачувување на македонското културно наследство. „Со Бранка пораснаа генерации слушатели, а сега им даваме можност на новите генерации повторно да уживаат во нејзината посебност. Голема желба ни е да ја вратиме Бранка во етерот, таму каде што припаѓа, не само како сеќавање, туку како глас што повторно живее“, додава тој.
Дигиталната реплика на гласот на Бранка Станковска е прв чекор во поширока иницијатива за дигитално реставрирање на гласови со културно значење. Од Tytl потенцираат дека ваквите технологии имаат огромен потенцијал за примена во забавната индустрија, образованието, културата и други области. „Со напредокот на вештачката интелигенција, станува возможна дигитална репрезентација што ја продолжува човечката присутност на начин кој досега бил незамислив. Секако, со оваа можност доаѓа и одговорност, етичкиот аспект секогаш мора да биде во преден план“, нагласуваат од тимот на Tytl.
Tytl.app е македонска платформа за масовна продукција на аудиокниги потпомогната од вештачка интелигенција. Книгите се читаат со повеќе вокали, збогатени се со звучни ефекти, а на екранот паралелно течат синхронизирани титлови и илустративни визуелизации генерирани од AI.
Платформата овозможува лесно прилагодување на брзината на читање, избор на различни стилови на нарација и персонализирани аватари. Благодарение на сопствениот модул SCENA, Tytl автоматски ги распознава сцените во текстот и ја усогласува музиката, амбиенталниот звук и динамиката на гласовите, а надополнувајќи го искуството со слики и видеа создавава вистински кинематографски ефект.
Платформата наскоро ќе стане достапна како веб-апликација и мобилни апликации (iOS и Android), а во тек е интеграција со паметни звучници и Smart TV уреди. Tytl е проект поддржан од ФИТР и е дел од NVIDIA Inception, светска програма за поддршка на иновативни стартапи во областа на вештачката интелигенција и генеративните технологии.