„Sora“ е модел со вештачка интелигенција од OpenAI кој може да ги претвори текстуалните барања во неверојатни видеа од 60 секунди и сега, од OpenAI велат дека ќе стане јавно достапен подоцна во 2024 година.
OpenAI првпат ја покажа „Sora“ оваа година, иронично на истиот ден кога Гугл го објави Gemini 1.5. Моделот со вештачка интелигенција од текст-во-видео го привлече вниманието поради неговата способност да создава неверојатни видеа засновани на текстуални инструкции, при што некои примери речиси не се разликуваат од вистинските видео снимки.
Како што е наведено, OpenAI рече дека „Sora“ е ограничена на видеа од 60 секунди, но резултатите беа прилично неверојатни. Сепак, досега единствениот излез што го видовме беше од OpenAI, бидејќи моделот не беше јавно достапен. Сепак, тоа наскоро ќе се промени.
Во интервју за The Wall Street Journal, Мира Мурати од OpenAI потврди дека „Sora“ доаѓа „дефинитивно оваа година“ и не сакаше да прецизира кога точно ќе се појави, но рече за „неколку месеци“.
Интервјуто исто така потврди дека OpenAI има за цел да им овозможи на корисниците да „уредуваат“ излез со директно барање да ги поправат проблемите во видеата. Моделот нема да работи со аудио засега.
Откаде „Sora“ ги добива своите податоци за креирање видеа, беше исто така суштински дел од интервјуто, при што Мурати потврди дека „јавно достапно“ видео и лиценцирано видео од Shuttershock биле користени за обука на моделот. Таа не одговорои дали се користени видеа на YouTube.
Подготви: Ј. Ѓ.