Сора, програма за генерирање видео за вештачка интелигенција (AI) создадена од стартапот OpenAI во 2021 година, предизвикува огромно внимание бидејќи сега излезе од фазата на истражување и официјално беше објавена во јавноста под новото име Сора Турбо.
Лансирањето предизвика негодувања меѓу корисниците, бидејќи компанијата привремено да го стопира создавањето на нови сметки откако имаше блокада поради голем сообраќај на веб сајтот
Сора користи текстуални предупредувања за креирање содржина, слично на другите програми за креирање содржина како што е ChatGPT. За разлика од традиционалните програми за вештачка интелигенција кои произведуваат писмени одговори, Сора создава висококвалитетни видеа врз основа на внесување текст на корисникот.
Sora is disgustingly good, gj @sama
Adding it to @everartai asap so you can bring your images to life pic.twitter.com/wMehxOc8cm
— Jay A (@jay_azhang) December 9, 2024
Според изјавата на OpenAI која го придружуваше објавувањето на 9 декември, Sora Turbo е подобрување на оригиналната програма Sora бидејќи овозможува побрзо создавање видео, видеа со повисок квалитет и мноштво функции за уредување на видео кои им овозможуваат на корисниците да создаваат видео секвенци и да менувате елементи во видеото додека ги зачувувате другите делови од видеото.
Значи, што точно е Sora Turbo и како ја менува индустријата за создавање видео?
Како работи Sora Turbo?
Моќта на Sora и на многу други видео генератори со вештачка интелигенција е способноста да го оствари она што луѓето можат да го направат со висококвалитетна филмска опрема, но Sora тоа го прави за исклучително кратко време.
Корисниците можат да ѝ дадат совети на програмата не само за тоа што да вклучи во видеото, туку и за кој тип на камера сакаат да користат, избор на објектив, поставување на осветлување, визуелна естетика, композиција и приказна.
Пример за барање за користење на некои од овие детали може да биде како што следува:
„Користи објектив (85 мм) за да снимиш интимен портрет на уличен продавач кој работи ноќе. Осветли ја сцената со мешавина од блескавите штандови на продавачот и поладните градски светла во позадина. Фокусирај се на деталите на рацете на продавачот додека подготвува храна, балансирајќи ја рамката со неговото експресивно лице. Сликата треба да прикаже напорна работа и гордост на неговиот занает“.
Колку е добра Сора Турбо?
Не е совршена.
Корисниците пишуваат текстуална порака за тоа каков тип на видео би сакале да генерираат и Сора го креира видеото. Има ограничувања во тековното издание. Квалитетот на видеото е до 1080p со 30 фрејмови во секунда и може да биде долго само 20 секунди.
Ова е пример за видеото на Sora Turbo од Еми Кусана, мултимедијален уметник и пејач на Satellite Young, музичка група инспирирана од џеј-поп и научно-фантастични теми од 1980-тите, користејќи теми од Такеноко-зоку, модна група од 1980-тите. Иако постои ограничување од 20 секунди, функцијата „Sora Storyboard“ им овозможува на корисниците да спојат повеќе видеа генерирани со вештачка интелигенција заедно и да ги распоредат последователно, како што е прикажано на видеото подолу.
Очигледни грешки се појавуваат и во некои видеа. На пример, во горното видео, на 36тата секунди, еден од танчерите прави вртење на вратот за 180 степени и ја продолжува танцовата рутина, што се разбира човечки не е возможно. Компанијата ќе мора да работи понатаму за да ги реши ваквите грешки, се вели во соопштението.
Во примерот на видео од жена која готви, објавено во февруари од Сем Алтман, основач на OpenAI, гледачите ќе забележат дека лажицата во десната рака на жената исчезнува откако таа ќе престане да меша.
https://t.co/rmk9zI0oqO pic.twitter.com/WanFKOzdIw
— Sam Altman (@sama) February 15, 2024
Како Сора Турбо е пречекана од филмската индустрија?
Некои експерти и креативни директори се загрижени за тоа како Сора може да ја наруши филмската индустрија, особено Холивуд.
Во март, еден извршен директор на Холивуд изјави за Ал Џезира под услов да остане анонимен: „Не го гледам тоа како закана за продукцијата колку закана за начинот на кој се прави продукцијата, како што во моментов го знаеме“.
Тој се осврна на промените во начинот на кој се вршеше постпродукцијата во минатото – како на пример кога луѓето почнаа да уредуваат видео на лични лаптопи наместо да им плаќаат на постпродукциските компании за да ја завршат работата.
„Многу луѓе беа избришани во таа транзиција, додека други одеднаш можеа да си дозволат да имаат соодветен уредник без големи трошоци“, рече тој.
Дали Сора е единствениот генератор на видео со вештачка интелигенција?
Не, не е. Пазарот за видео генератори со вештачка интелигенција расте секој ден. Сепак, една јасна разлика помеѓу Сора и другите конкуренти е неспоредливиот квалитет на видеото и реализмот што Сора може да ги произведе.
Покрај тоа, новото издание, Sora Turbo, доаѓа со мноштво напредни функции за уредување видео што корисниците би можеле да ги најдат на Adobe Premiere Pro или Final Cut Pro, две многу популарни софтверски програми за уредување видео што се користат во филмовите, ТВ и креирање онлајн содржини.
Покрај тоа, Сора финансиски е поддржана од мега софтверската компанија Мајкрософт. До денес, Мајкрософт има инвестирано речиси 14 милијарди долари со најновата инјекција од 10 милијарди долари на 23 јануари. Според CNBC во октомври, OpenAI сега има револвинг кредитна линија од 4 милијарди долари, со што вкупната ликвидност изнесува повеќе од 10 милијарди долари. Тој износ на инвестиција и дава на Сора ниво на потпора што многу други конкуренти го немаат.
Кои други видео генератори се достапни?
Постојат неколку други генератори на видео со вештачка интелигенција што се на високо ниво.
Runway Gen 3
Runway, основана во 2018 година, собра вкупно 237 милиони американски долари за финансирање и, наводно, е во преговори со фирмата General Atlantic за да собере капитал од 450 милиони американски долари, според The Information, публикација која ја покрива технолошката индустрија и индустријата за ризичен капитал. Бесплатната верзија на Runway Gen 3 може да генерира видео клипови од 10 секунди со резолуција од 720p со 30 фрејмови во секунда. За претплатниците, видео клиповите може да се постават на 1440p или 2160p.
Слично на Sora, може да создаде видео врз основа на текст, но многу се потпира на креаторите кои го користат за да креираат реклами поради неговата голема брзина и ефикасност во видео проекти во кратки форми.
Еден од предизвиците на видеото генерирано со вештачка интелигенција со долга форма е конзистентноста на повеќе генерирани видеа. Подолгите видеа бараат интерактивно брзо усовршување за сите видеа да изгледаат исто.
Kling AI
Kling, поддржан од Kuaishou, кој е познат и како Kwai, е голема кинеска технолошка компанија со седиште во Пекинг, Кина. Kling беше претставен во јуни 2024 година и се позиционира како конкурент на Sora. Kling може да генерира видеа долги до две минути со резолуција од 1080p со 30 фрејмови во секунда.
MiniMax
MiniMax, кинески стартап за вештачка интелигенција е поддржан од Alibaba Group Holding, мултинационална компанија специјализирана за е-трговија, интернет услуги и технолошки услуги со седиште во Кина и чија најнова рунда на финансирање беше 600 милиони долари во март. MiniMax е основана во 2021 година од поранешни вработени во SenseTime, водечка компанија за вештачка интелигенција со седиште во Шатин, Хонг Конг.
Minimax може да генерира видео клипови од шест секунди со резолуција од 720p и 25 фрејмови во секунда.
Извор: Aljazeera
Подготви: Ј. Ѓ.
Прочитајте и…
(ВИДЕО) „Sora“ генераторот на видеа со вештачка интелигенција јавно достапен во САД