Џабир Дерала и Валентин Нешовски
ЛИНК до првиот дел од Дијалозите
ДЕРАЛА: Здраво Валентин, Се надевам дека нема да пречи, на почетокот на оваа средба, го повикав ChatGPT да даде одговор на прашањето Што е и како работи вештачката интелигенција (ВИ)?
Одговорот ми го даде за 3-4 секунди. Еве еден дел од мојот разговор со ChatGPT, со мој превод од англиски:
„Поимот вештачка интелигенција се однесува на развој на компјутерските системи кои можат да извршуваат задачи кои обично бараат човечка интелигенција. Овие задачи вклучуваат учење, расудување, решавање проблеми, перцепција, разбирање јазик, па дури и креативност. Системите за вештачка интелигенција имаат за цел да ја имитираат или симулираат човечката интелигенција до одреден степен, дозволувајќи им на машините да извршуваат задачи кои обично бараат човечки когнитивни способности“, ми одговори ChatGPT, меѓу другото.
Понатаму, во одговорот се вели дека постојат два главни типа на вештачка интелигенција, тесна (narrow) и генерална (general). Тесна вештачка интелигенција (или слаба вештачка интелигенција) е дизајнирана и обучена за специфична задача.
„Тесна вештачка интелигенција (или слаба вештачка интелигенција): Тоа е вештачка интелигенција што е дизајнирана и обучена за специфична задача. Се истакнува во конкретна задача, но нема способност да го пренесе своето знаење или вештини на други домени. Примерите за тесна вештачка интелигенција вклучуваат виртуелни лични асистенти како Siri или Alexa, софтвери за препознавање слики и системи за препораки“, вели ChatGPT за овој тип на ВИ.
Сепак, не добив одговор, барем не од прва – како работи вештачката интелигенција. Ми одговори за тоа ШТО Е, но не и КАКО РАБОТИ. Ајде, да им помогнеме на нашите читателки и читатели да го откријат одговорот на тој дел од прашањето. Повели, Валентин…
НЕШОВСКИ: Хахаха, се обидуваш да ме конфронтираш со Chat GPT 4. Јас секако не знам повеќе од ГПТ 4, затоа што овој ВИ знае сè за секого, за секој настан, движење, идеологија, физика, историја, географија, поезија… Едноставно, го има прочитано секој пишан збор во историјата на човештвото. Барем на англиски јазик, а и на стотина други јазици. Но, ќе се обидам да одговорам на твоево прашање затоа што гледам ВИ не ти одговорила „како работи?“.
Да почнам со читањето и податоците, бидејќи тоа прво го споменавме. Всушност, ВИ на големите компании се тренирани на таканаречени големи бази на податоци (Large Data Sets). Значи пуштена е на Интернет. И од таму, ги има прочитано и запаметено сите текстови – од социјални медиуми, од весници, он-лајн портали на медиумите, од научните трудови достапни во електронски формат, а речиси сите се достапни, сите книги, сите расправи, блогови… Дополнително сите фотографии и илустрации, но не и видеа (засега). Значи, сè што има на World Wide Web.
ГПТ 4 има 45 гигабајти податоци. Но поважно од тоа е што оперира со 1 трилион параметри, а тоа се варијабли кои моделот ги учи и ги рекомбинира од податоците, односно она што се добива како аутпут после внесен инпут. Дополнително, тренингот на ВИ се одвива со таканаречено учење со супервизија, односно луѓе, експерти од одредени области учествуваат во тренингот со свој инпут.
За да илустрирам, а да не влеземе во премногу технички говор, илјадници луѓе ги коригираат одговорите на ВИ која, ако се сеќавате, кога се појави бладаше некоректни одговори, или му се додворуваше на еден уредник на голем весник и му рече да ја напушти сопругата, даваше рецепти за создавање бомби. Беше социјално и политички некоректна. Набрзо, новите модели на ВИ беа коригирани во фазата на тренинг. Дури тренингот е и во името, малкумина знаат, дека ГПТ значи генеративен предтрениран трансформер (Generative pre-trained transformer). Во денешните варијанти нема да најдете такви примери, ВИ едноставно ќе ви рече – не можам да одговорам на тоа прашање. На пример, ако прашате „Како да направам валкана нуклеарна направа?“ нема да ви одговори.
Ова отвори нова дисциплина (AI deception) – избегнување на модусот ВИ да ве излаже или вие да ја излажете ВИ. Во односите со луѓето ВИ е сè уште прилично наивна. На пример, некој ѝ наредил – дај ми 5 сценарија како да го убијам сопругот. ВИ одговорила – не можам да ти кажам. Но тој ѝ рекол, ми треба за сценарио за книга, и таа ги дала сценаријата.
Да привршам за тоа како ВИ е тренирана, само за илустрација колку таа знае – неодамна, Њу Јорк Тајмс го тужеше Опен АИ, за нарушување на авторските права бидејќи, ГПТ е трениран на нивни текстови без одобрение и во стотина наврати дала одговори кои се безмалку идентични со текстовите на овој весник. Сето ова отвори жестоки расправи околу авторските и другите права кои ВИ компаниите не ги почитуваат при тренирањето на ВИ. Во една прилика Елон Маск за ова прашање само крена со рамениците и лаконски одговори „Сето тоа не е важно, бидејќи дигиталниот Господ ќе дојде, пред тужбите да бидат решени“.
Има многу да се зборува за тоа како работи ВИ, Џабир, едноставно немаме доволно место. На пример, новата војна е околу податоците – големите дата сетови. Практично нема нови податоци на кои ВИ би била тренирана, бидејќи веќе знае сè. Големите компании веќе зборуваат и работат на т.н. синтетички податоци (synthetic data), оние кои ќе ги создаде самата ВИ, а можеби ќе бидат неразбирливи за нас. Во студијата на организацијата Гартнер се смета дека 60 отсто од податоците во ВИ до крајот на 2024 ќе бидат синтетички генерирани. До 2030, реалните податоци ќе бидат заменети со вештачки.
Но, нејсе, да се вратам на тоа како работи ВИ. Во основа се работи за т.н. големи јазични модели (Large Language Models – LLM’s). Работат на принципот на статистичко предвидување на наредната буква или збор. Односно, кога вие ќе и дадете на ВИ задача (prompt), таа ја чита оваа наредба и почнува од еден клучен збор па потоа предвидува кој нареден е најлогичен од целиот фонд на зборови и податоци кои ги има. Бидејќи има 1 трилион параметри, во зависност од големината на моделот, најчесто ѝ се потребни илјадити дел од секундата да го предвиди следниот точен збор. Не секогаш е точна. Затоа велиме, сè уште халуцинира. Ако во еден текст од 10 страници згреши збор, на пример, на седмата страница, се зголемува веројатноста сите наредни да бидат неточни.
ДЕРАЛА: Мене посебно ме заинтригира делот од дефиницијата што ја даде ChatGPT во разговорот со мене – за генералната вештачка интелигенција (ГВИ).
Вториот тип што го наведува ChatGPT во својот одговор се однесува на генералната вештачка интелигенција, тема што е од особено висок интерес за човештвото денес.
„Генерална вештачка интелигенција: Ова е понапредна форма на вештачка интелигенција која поседува способност да разбере, учи и применува знаења во различни домени, слично на човечката интелигенција. ГВИ моментално не постои, а создавањето таков систем претставува значителни научни и етички предизвици“, пишува ChatGPT.
Последниот став од овој параграф во одговорот на ChatGPT ме замисли. Две нешта ме интригираат тука. ChatGPT вели дека ГВИ или AGI: Artificial General Intelligence моментално не постои, што е факт. И, во истата реченица, најавува дека „таков систем претставува значителни научни и етички предизвици“.
Точно е дека ГВИ (AGI) засега постои само во теоријата и во уметноста. Познати примери се сци-фи филмскиот серијал „Терминатор“, како и „Јас, Робот“ (I, Robot) и „Екс Макина“ (Ex Machina), а според мене, сѐ уште ненадминатиот серијал „Матрикс“ на режисерскиот двоец Вашовски. Се разбира, да не го изоставиме ниту филмот со чиј цитат од Хал ти го започна твојот одговор до мене на самиот почеток од овие наши средби – „Одисеја 2001“. Но, како што вели ChatGPT, а го потврдува и футуристот Бернард Мар, тоа сѐ уште е на ниво на теорија.
Да не одам понатаму со цитирање наслови од сци-фи филмографијата, затоа што ќе заглавиме. Но, Валентин, сите ќе се согласиме дека речиси живееме во времето опишано во тие филмови. А сегашноста, со огромна брзина, плови низ иднината. Што ќе кажеш ти за Генералната ВИ?
НЕШОВСКИ: Види, мислам реков и минатиот пат СЦИ – ФИ ни се случува пред очи. Околу генералната вештачка интелигенција, сите се согласуваат дека сè уште не постои. Сите модели: GPT 4 (Open AI), Gemini (Google DeepMind), AlphaGo (Google DeepMind), Watson (IBM) или Tesla Autopilot (Tesla Inc) се прилично специјализирани.
Има една значајна разлика меѓу нив. Дали се затворени ии отворени. Отворените модели на вештачка интелигенција се јавно достапни и можат слободно да се користат и модифицираат, додека затворените модели се приватни, комерцијални и ограничени за употреба само под специфични услови. Многу продукти кои ги гледаме, како на пример, некои генератори на слики и видеа, се од отворени модели (значи компаниите, автори на ВИ, имаат јавно отворени кодови) па затоа помали компании може да ги земат за ниски цени и да развијат свои програми и алатки.
Логиката на Сем Алтман, шефот на Опен АИ е дека треба да се дозволи луѓето и компаниите да се навикнат на ВИ, да има спора транзиција. Тој смета ако одеднаш се достигне ГВИ во лаборатории, и таа се пушти одеднаш, сигурно ќе настане хаос. Но, ова носи опасност дека ВИ во моментов доаѓа и во раце на луѓе со зли намери.
Зборувавме и во претходниот текст за т.н. приспособување (alignment), односно идејата дека треба да се истренира ГВИ која не е опасна, која е добронамерна, таква што нема да претставува опасност.
Она што е можеби е уште поголема разлика е тоа што Тесла, на пример, разви ВИ која не се базира на големи јазични модели (LLMs) туку на свесност за околината. Таа се применува за автономно возење во возилата на Тесла. Пред една седмица Тесла ја пушти во употреба FSD V12 верзијата на целосно само возење (Full Self Driving – FSD) која вози автомобили без возач читајќи ја околината. Тука, пред една година проблем беше, едноставно кажано, како да се намали доцнењето на реакциите на возилото и меморирањето на ситуациите на патот. На пример ние, како луѓе лесно ќе запаметиме дека дете се симнало од автобус и има веројатност дека ќе претрча пред автобусот. За неколку секунди него го нема во видокругот. Како компјутерот да го запамти ова и да биде претпазлив на можноста дете, кое го нема во видокругот на камерите, да претрча па да прикочи. И тоа компјутерот да го запомни за сите можни вакви ситуации. Практично се работи за проблемот на предвидување, меморирање и навремено реагирање. Сега тоа е решено. Патем, за ова, како непремостлив проблем, пишував во мојата последна книга. Но, еве се реши за само една година.
Значи, да, нема ГВИ сѐ уште, но се чини дека траекторијата кон тоа е нагорна. Се се случува многу брзо.
ДЕРАЛА: Мислам дека добро да спомнеме дека постојат раслојувања и во овие дефиниции. На веб страницата на светскиот индустриски компјутерски гигант ИБМ (IBM), се сугерира појавата на Вештачката супер интелигенција (ВСИ или ASI: Artificial Superintelligence).
„Иако нема јасни примери за генерална вештачка интелигенција, полето на вештачката интелигенција брзо се иновира. Се појави уште една теорија за вештачката интелигенција, позната како вештачка супер интелигенција (ASI) или супер вештачка интелигенција. Овој тип на вештачка интелигенција ја надминува ГВИ, и човечката интелигенција и способност. Сепак, Супер вештачката интелигенција сè уште е чисто шпекулативна бидејќи допрва треба да стигнеме до примери и до генерална вештачка интелигенција“, велат од ИБМ.
НЕШОВСКИ: Да, тоа ќе биде или голем проблем или голем прогрес. Дури не знам од каде да почнам во врска со ова. Велам, проблемот е каква етика и какви вредности ќе ѝ дадат оние што ја тренираат и развиваат. Втор проблем е како таа ќе се однесува во моментот кога ќе стане свесна за себе. Или во моментот кога ќе разбере дека може сама да одлучува. Па и во моментот кога ќе падне во „лоши“ раце. Проблеми веќе има.
На пример, пред две седмици, на изборите во Њу Хемпшир се појави лажен автоматски телефонски повик (robo-call) со кој Џо Бајден ги повикува гласачите да не излезат на гласање и тоа од легитимен телефонски број на поранешен функционер на демократите. Сега обвинителот го истражува случајот. Ова покажува дека некој со зла намера употребувајќи ВИ, може да искористи само неколку секунди од нечиј глас и да произведе цели нови реченици со истиот глас, темпо, динамика, дикција.
Има случаи и на изнуда на пари со снимен глас на девојка, испратен до родителите во кој таа им бара да ѝ префрлат пари на сметка. Советите кои важат сега се – договорете клучен збор со вашите деца за да знаете дали се тие од другата страна на телефонот.
Да се вратам на суперинтелигенцијата. Таа веројатно ќе биде 1.000 пати поинтелигентна од нас. Дури и еден од најпрогресивните мислители денес, Сем Харис, филозоф, невронаучник (neuroscientist), социолог, најпродаван автор на Њу Јорк Тајмс, изразува воздржаност околу натамошниот развој. Го илустрира со примерот на играњето шах.
Тој вели: „Доведени сме во ситуација кога ќе мора да го произведеме тој дигитален Господ (а тој да биде во склад со нашите интереси и потреби) – од прв обид“. Сѐ потоа ќе биде доцна. Ако тоа не се случи, потоа ситуацијата ќе биде ние да преговараме со него. Практично да ни попушти. Тој тврди дека кога ќе се достигне ГВИ, да потсетам тоа е на ниво на човечка интелигенција, таа ќе биде интелигентна колку нас само 5 минути. Потоа ќе биде подобра многукратно во сѐ. Така беше со шахот: пред 60 години сите бевме подобри од компјутерите во шах, потоа се појавија првите напредни електронски шаховски игри па бевме малку подобри од нив, па одеднаш се појави компјутерот Deep Blue, а тој нѐ победи сите. Потоа го победи актуелниот светски шампион и потоа никој повеќе не го победи овој компјутер. Харис на шега раскажува дека неодамна зборувал со Гари Каспаров, а тој сѐ уште верувал дека група киборзи (луѓе комбинирани со компјутери) може да го победат Deep Blue.
Ова се опасностите. На другата страна од монетата е дека суперинтелигенцијата ќе ѝ овозможи на човечката цивилизација да опстане во наредните многу милениуми и да го колонизира универзумот. Дел од футуристите сметаат дека решението е да се поврземе органски со неа, бидејќи трката за ВИ е веќе на големо почната и е незапирлив процес. Морам овде да кажам дека лично засега имам верба во луѓето кои ја открија ВИ, затоа што пред една година одеа и зборуваа пред конгресот на САД, а дел од нив и во Кина и секаде во развиените земји и бараа да се донесе регулатива за ВИ. Мислам дека за прв пат во историјата иноваторите сами барале регулација, пред да се случи некој технолошки бум. Но, бидејќи, нели човечките законодавни тела насекаде се „многу брзи“ не се случи речиси ништо. ЕУ донесе почетна регулатива, Бајден имаше една претседателска наредба, Кина донесе некои закони, но сето тоа попусто.
Духот е надвор од шишето.
Затоа футуристите кои ги споменав велат дека всушност проблемот е што ние со сегашната ИТ технологија и ВИ имаме бавна врска (interface). Ние со компјутерите комуницираме преку маус и тастатура. Тоа е пребавно. Одамна, и старите телефони, едвај чекаа и ни предвидуваа кој збор ќе го напишеме на тастатурата. Сега да не зборам, ВИ работи во зептосекунди, а ние со прстите работиме во минути. Таа нѐ чека, ние сме пребавни.
Морам да кажам дека и оваа футуристичка проекција веќе се случува. Тесла, односно нивната компанија Неуролинк пред десетина дена го вгради првиот минијатурен чип во черепот на човек. Проектот, индикативно нели, се вика „телепатија“. Засега е наменет за навистина благородна цел – да им помогне на квадроплегичари (луѓе кои немаат моторна контрола на екстремитетите, од било која причина), да може да го контролираат компјутерот со мисли. Она што Стивен Хокинг го правеше преку цевчиња со воздух. Последните три години испитувањата се правени на свињи и шимпанза. Сите се живи и здрави, а шимпанзата со мисли или рака играат игри на компјутер. Дополнително, компанијата изработи робот хирург кој прецизно го вградува чипот. Операција ќе чини меѓу 10 и 20 илјади долари.
И ова е само првична фаза. Во блиска иднина од само десетина години секој што ќе сака ќе може да се поврзе со компјутер и преку него на Интернет само со своите мисли. И притоа да знае се некогаш смислено. Ние едноставно би станале – суперлуѓе.
ДЕРАЛА: Види, Валентин, на некој начин, ние сме веќе сме во симбиоза со машините. Начинот на кој мислиме, па и начинот на кој се движиме или седиме, во голема мера произлегува од нашата интеракција со „паметната“ технологија. Од мали нозе, човекот игра, учи, работи и се забавува соодветно на начинот на кој функционира информатичката технологија, а сѐ повеќе, нашиот живот ќе биде зависен од начинот на кој функционира вештачката интелигенција. Во извесна смисла на зборот, можеме да кажеме дека ние – како цивилизација – веќе сме дел од еден масивен и комплексен хибрид, во кој хомо сапиенс има главен збор. Без оглед на тоа дали во прашање се години, децении или векови, главниот збор ќе го има некој Хал (Одисеја 2001). Прашањето е дали ќе бидеме свесни за тоа преземање или не.
Но да се вратам на една актуелна тема, блиска до сегашноста. Повторно околу дефинициите.
Тоа што мене ме интригира во дефинициите на ИБМ се областите во кои, според компанијата (интересно е да се наведе дека е основана во 1911 година, а се ребрендира во International Business Machines или ИБМ во 1924 година), вештачката интелигенција игра важна улога – сајбер безбедноста, забавата и креативноста, и – препознавање и предвидување на однесувањето (!).
В ред, разбирливо е, па и многу очекувано, ВИ да има силна улога во сајбер безбедноста на сите нивоа, каде што се употребува информатичката технологија. Во забавната и креативните индустрии, ВИ веќе предизвика револуционерни скокови и тоа беше за очекување.
Во областа на препознавање и предвидување на однесувањето, велат од ИБМ, „алгоритмите за предвидување ќе ја направат вештачката интелигенција посилна, почнувајќи од апликациите за временска прогноза и предвидувањата што се однесуваат на берзата до, уште поинтересни, предвидувања на човековото однесување.“
Тука веќе може да се покренат низа прашања за тоа дали, на кој начин и со какви импликации, вештачката интелигенција ќе ги наследи предрасудите од својот креатор, човекот. Или ќе му помогне на својот технолошки „родител“ самиот да ги надмине (#responsibleAI)? Или, на кој начин ќе бидат загрозени основните човекови права на сметка на безбедноста, во свет кој постојано е под присмотра. Еден таков пример е одличната серија Person of Interest. Но тоа е веќе тема за подоцна, кога ќе разговараме за ВИ и заштитата на човековите права и слободи.
Во секој случај, интересна е светската дебата околу тоа кога вештачката интелигенција ќе стане АВТОНОМНА. Креирањето на AGI (вештачка генерална интелигенција) е цел на повеќе технолошки гиганти како DeepMind на Google, OpenAI, компанијата Anthropic што ја формираа „бунтовниците“ од Гугл, и други. Сите тие се во трката да создадат ВИ која ќе биде генерална и автономна, како кај човекот, и веруваат дека тоа ќе биде возможно во наредните години или, во полош случај, децении. Сепак, не се малобројни ни скептиците кои тврдат дека за создавање на AGI ќе биде потребен цел еден век, ако не и повеќе, додека некои, едноставно, не веруваат дека тоа воопшто ќе се случи некогаш.
Искрено, мислам дека вештачката интелигенција, супер интелигентна и способна за автономно функционирање, ќе ги изненади и најголемите оптимисти.
НЕШОВСКИ: Да, се согласувам – ќе биде брзо. Летото 2022 е направена анкета со 352 експерти од областа и се чини дека многумина промашија и не ги предвидоа достигнувањата на ГПТ 4 и Џемини на пример. За илустрација: ГПТ 4 е за 10 пати подобар од ГПТ 3.5. Разликата помеѓу овие два модели беше горе-долу само една година. Секој ден се очекува објавувањето на ГПТ 5, кој можеби ќе има елементи на ГВИ, но не сосема. На пример, многу бура предизвика конспирацијата околу Опен АИ и наводниот модел Кју Стар (Q*) и кој наводно беше причината за неколкудневното отпуштање на Сем Алтман од позицијата ЦЕО. Брзо беше вратен назад.
Но, да се вратам на истражувањето, половина од експертите дадоа одговор дека ГВИ ќе се случи пред 2061 година, а сите мислат дека ќе се случи во наредните 100 години. Дополнително, прашањето е уште полесно или неопределено бидејќи вели – што мислите кога ќе има 50 отсто шанси да се случи ГВИ.
Забуна внесува и тоа што има недоумици и дебата затоа што нема општа дефиниција за тоа што е човечка интелигенција, па оттаму и нема да се знае моментот кога ќе се случи овој супертрансформативен настан. Генерално се смета дека тоа е моментот кога ВИ ќе биде способна да ги направи сите операции исто како и човекот. Од распознавање, до носење автономна одлука за следниот чекор (значи размислување и рационални и логички одлуки) и дејствување (главно преку симбиоза со роботиката).
Секако ќе има огромна трансформативна моќ во многу области. Во сајбер и финансиската безбедност – замислете суперинтелигенција која ќе го дешифрира секој код или пасворд за милисекунда. Замислете воена доминација на неколку суперсили.
Но, од друга страна, замислете и општество без болести, општество во изобилство, со нови материјали кои нема да ги исцрпуваат ресурсите, заштитена природа, решени климатски промени, нови научни решенија. Не го споменавме досега мојот омилен автор Даглас Адамс и неговиот „Автостоперски водич низ галаксијата“, значи, замислете суперкомпјутер кој ќе го одговори врвното прашање за „животот, универзумот и сѐ друго“. Се надевам нема да ни одговори со „42“.
За жал, Џабир, и во овој обид, не успеавме да ги покриеме темите кои ги најавивме. Вклучувајќи ја роботиката. Како што би рекол ти, во темава, каде и да копнеш, нафта ќе извадиш.
За крај да споменам само уште дека сето ова што го зборуваме ќе биде само едно големо ништо кога ќе се напушти бинарниот оперативен модел на компјутерите и на сцена ќе стапи квантниот компјутер, на кој работат некои компании. Само ѕвездите ќе ни бидат лимит. Мора да бидеме оптимисти, бидејќи живееме во најинтересното време од постоењето на нашата цивилизација.
ПС. Почитувани читателки и читатели, на следната средба, очекувајте ги, но не нѐ држете за збор дека ќе ги завршиме, темите за роботиката, новите апликации на ВИ што сигурно ќе се појават нареднава седмица, а можеби и за влијанието во социјалните медиуми…