Button-svg Transkribering

Maskininlärning tillgängliggörs för den stora allmänheten i explosion av AI-tjänster som Midjourney och ChatGPT

Martin

Radio Bubblas årskrönika över 2022 går vidare till teknikavdelningen. Årets mest intressanta tekniknyhet måste rimligen vara explosionen av offentligt tillgängliga tjänster som bygger på storskalig maskininlärning. AI i folkmun. ML eller LLM med mer tekniska termer.

I början av 2022 så fanns det bara några enstaka möjligheter. för en vanlig människa att interagera med den här typen av system. Det fanns till exempel ett gränssnitt till GPT-3 eller GPT-2, någon av dem. Som jag tror lanserades 2021. Och jag satt och experimenterade några kvällar med det här systemet, men det var krångligt att få tillgång till.

Jag var tvungen att gå igenom en sån där ansökningsprocess och berätta vad jag skulle använda det till och så vidare. Men under 2022 så inträffade en explosion, en kaskad av explosioner. Det gick väldigt snabbt allting. I april lanserades DALY som var det första offentliga ML-systemet som kunde konstruera bilder med godtyckliga motiv baserat på textinstruktioner.

Sen kom Mid Journey i juli som vi gjorde ett inslag om här i radion och i augusti kom Stable Diffusion som är en open source version av samma sak som finns under huven på DALY och Mid Journey. Men det är alltså mindre än fem månader sedan som Stable Diffusion släpptes. Om man har följt de här sakerna någorlunda nära så är det svårt nästan att greppa det i tidsperspektivet.

Allting har gått så snabbt. Och så har vi såklart, det är text till bildsystem, sen har vi också text till textsystem. Och det som har fått mest uppmärksamhet är såklart ChatGPT som vi pratat om här i radion också. Och som tagit världen med storm, åtminstone det segment av världen som har lite koll på vad som faktiskt pågår.

Jag vet inte om SVT pratar om ChatGPT men intelligenta människor som följer viktiga saker pratar enormt mycket om det och de andra liknande systemen. Och väljer just det här chat-systemet efter lanseringen. Lanseringen tog fem dagar innan de hade en miljon användare.

Vilket är ett världsrekord med rätt god marginal i användaranskaffning. Den lanseringen var den 30 november, alltså mindre än sex veckor sedan. Det är helt sjukt att tänka på givet hur mycket som har hänt sen dess. Bara idag läste jag om att ett skoldistrikt i USA, jag tror att det var i New York, De blockerar nu chat-GPT på sina datorer för att det är så lätt att använda systemet för fusk.

Man kan säga åt dem, skriv min hemläxa, skriv min sä åt mig. Det är verkligen tur att inga elever i New Yorks skolor har tillgång till datorer utanför skolan. Då skulle de kunna använda chat-GPT utanför skoltid och då skulle det här förbudet vara helt meningslöst. Eller snarare det skulle bara slå mot fattiga människor som inte har råd med det.

Det är väldigt tur att de är kloka och inte gör den sortens misstag. Jag har själv börjat använda GPT för mina egna läs- och skriv- och tankeprojekt. Så jag har faktiskt ett par av mina privata forskningsprojekt. som jag håller på med att pilla med. Mina oceaner av fritid har tagit ett stora steg framåt faktiskt.

Med GPT så har jag kunnat göra på några timmar vad som förmodligen hade tagit veckor eller månader eller varit omöjligt att göra för hand. Jag har hittat ganska intressanta sätt att få den att framförallt jobba med väldigt gammalt arkivmaterial som skulle vara väldigt svårt att gräva fram ens på nätet. Jag är egentligen inte aktivt på att använda det för programmering, men jag har en hel hög med idéer på mjukvaruprojekt som jag nu tror att jag kan genomföra utan större problem.

Som tidigare kändes övermäktiga på grund av mängden rutinarbete som krävdes och olika typer av kompetenser som jag inte har personligen, men som de här datorsystemen har. Jag är fortfarande en primitiv och orutinerad användare av de här systemen. som jag känner gör redan otroligt häftiga saker, inklusive kommersiella och lönsamma saker.

Det är GPT. Det finns klart flera konkurrenter, men jag ska säga det också. Det finns ett företag som heter YouChat, som är en chat-baserad sökmotor. Det är som ett alternativ till Google eller DuckDuckGo eller något sånt där, men som bygger mycket på det här AI-chat-motorn. Paradigmet. Det finns Jasper Chatter, Ghostwriter, det finns det en som heter och så vidare. Det kommer jättemånga sådana här konkurrenter nu.

Och det är förut en sak som är bra vetat. Chat, GPT och OpenAI som ligger bakom. De var absolut inte först med att utveckla en så kallad språkmodell av den här sortens omfattning. Deras innovation var framförallt att tillgängliggöra den. Google, den här tekniken uppfanns på Google och Google har internt minst två liknande system som också sägs av folk som har testat dem, det sägs att de är mycket bättre än GPT.

Man vet det här därför att de har beskrivits på olika sätt. Men det är i stort sett bara folk på Google som kan använda dem. I övrigt finns det bara en massa papers som de har publicerat, där de beskriver hur de gör med systemen. Men den grundläggande matematiken bakom, den grundläggande datametenskapen bakom, sådana här transformatorer och sådana här begrepp som de har, de kommer från Google och det är Google som är bäst. Men Google har aldrig gjort en produkt av det.

Google är inte intresserade av att lägga ut det här som en produkt. Det är eventuellt ett intressant ämne. AI-projekt som också kommer från OpenAI som utvecklar GPT.

Whisper är en sån här modell som de har tränat inte på text utan på 700 000 timmartal på många olika språk. Den kan göra otroligt bra transkriberingar av tal till text och dessutom översättningar. Den kan transkribera till stort sett vilket språk som helst. Som ett parentes håller vi på just nu och matar in hela radiobubbla-arkivet. till Whisper. Har jag berättat det här för dig, Boris? Nej.

Boris

Jo, det har du inte.

Martin

Jo, du fyllde inte, försäkta. Vi har en AI-expert på BBS-nätverket som har börjat mata in dina mina samtal i det här röstningarkänningssystemet. Och den spottar ur sig kompletta transkriberingar av allt vi någonsin sagt i Radio Bubbla. Och det är fortfarande lite sådana här tekniska grejer som vi vill liksom...

räta ut för att vi vill att det ska gå perfekt. Men det jag har sett, exempelvis, som har kommit ut ser jättebra ut. Så förhoppningsvis kan vi tillgängliggöra Radio Bubbla som ett komplekt textarkiv där man kan textsöka genom allting som vi någonsin har sagt. Det är bara på vår egen lilla bakgård så håller det på att hända väldigt balla saker. En annan grej som jag väldigt exalterar personligen för det jag är intresserad av musik är system som genererar musik utifrån en textprompter.

Jag vill ha ett stycke i C-dur som ger in i den här känslan till lyssnaren och det ska låta som att det är Wolfgang Amadeus Mozart som har komponerat det. Det finns flera sådana system, det kommer garanterat att komma fler. Musik är svårare på grund av copyright, men det är en uppenbar och oundviklig utveckling.

Jag är ingen A-expert, men jag tror att... Jämfört med att generera texter som GPT så tror jag att det skulle vara enkelt att generera musik. relativt sett. Som till exempel ett stycke klassisk musik som är nyskrivet men som låter som att det är komponerat av Mozart eller Bach eller Wagner eller sånt där. Jag tror att det skulle vara ganska enkelt i att generera vilken text som helst.

För att det ändå är så väldigt liksom... Det går ju absolut att bryta ner vad som källetecknar deras musik. Musik är i grunden inte superkomplex. Det finns bara tolv toner och så, så många akkord och så vidare. Men med resolution då förändrar copyright-maffian i musikbranschen... är superstark och det kan hända att de bara stänger ner alltihop. Men om inte det händer så tror jag vi är där snart. Tekniskt inga konstigheter, det skulle vara ganska balt faktiskt att kunna lyssna på skräddarsydd musik, precis det man vill lyssna på, utveckla sitt dialog med AI-systemet och producera den optimala musiken.

Jag som musiknörd skulle tycka att det var helt fantastiskt. Många vetenskapliga applikationer, vi har till exempel Alphafold från Google. Google och Google som är ledaren, Google Deep Mind heter deras organisation, som är världsledande på de här sakerna. Alfa Fold är en specialiserad ML-modell som har gjort enorma framsteg i att lösa det berömda proteinvikningsproblemet.

Det är ett jätteviktigt problem inom biologi. Och det finns ett system som heter BioNemo från Nvidia som är inte en, utan en samling av... av ML-modeller för biologiska och kemiska applikationer, inklusive för proteinvikning, men också mycket annat. Det finns ett, DeepMind utvecklar också ett kontrollsystem för fusionsreaktorer i samarbete med ett universitet i Schweiz.

Det finns en AI-system nu som spelar Diplomacy, som är ett spel för mänskliga spelare, som kräver att spelare hela tiden kommunicerar med varandra för att diskutera och förklara. förhandla kring skedan i spelet så att man skriver i fri form. Det är som att trycka på knappen att man skriver text i fri form som de andra spelarna sedan läser. Och man måste göra det på ett strategiskt sätt, man måste kunna bluffa och så vidare.

Nu finns det ett AI-system som slår människor i det här spelet. Och eftersom jag är intresserad av Minecraft så måste jag nämna också Mine Dojo som är en AI-system. som spelar Minecraft. De har tränat det AI-embellysystemet genom att låta den kolla på YouTube. Den har kollat på YouTube 300 000 timmar och utifrån det har de transkriberat 2 miljarder ord.

som har sagt sig i de här Minecraft-videos. Och sen har de läst in givetvis Minecraft-wiki med 7000 sidor med alla regler för Minecraft. De har läst in hela Reddit, Minecraft, Reddit. 340 000 inlägg. 6,6 miljoner kommentarer i den här modellen. För att den ska lära sig Minecraft. Och den kan nu...

Den kan utföra diverse handlingar i spelet genom att man ger en instruktion ungefär som GPT. Man kan till exempel bygga ett hus av sten med ett rött tak och sen så gör den det. Eller mycket mer komplexa saker. Det är väldigt fascinerande och skrämmande tycker jag och väldigt intressant.

Men poängen är att den här AI-revolutionen som vi har blivit inne i... Jag har vetat väldigt länge att den ska komma, men den har inte riktigt liksom lossnat, inte riktigt kommit igång. Det har ofta varit att den ligger ändå några år framåt. Det kommer ML och AI används mer och mer på olika specifika applikationer. Men de här stegen mot mer, inte generell intelligens, men mer generella typer av applikationer.

Jag är ganska säker på att 2022 kommer att bli ihågkommet historiskt som det året då den här explosionen verkligen började. Boris, du som inte är lika mycket av en tekniknörd som jag, hur ser den här AI-explosionen ut från din horisont?

Boris

Det är en invasion på mina områden. Det här är det säger de att det går fort. Det är inte bara så att det exploderar i slutet på 2022. 2023 inleds ju med en små explosion hela tiden. Ett exempel, notisflödena de senaste två dagarna i morgonposten har ju bara varit, inte bara men det har varit märkligt många AI-nyheter.

Apple lanserar AI-ljudböcker. Den mänskliga berättarrösten tänker de ta bort i synnerhet till de har redan kommit med en katalog alltså. De har byggt upp röster som passar för olika genrer och även för olika typer av författare och så vidare. Och i princip så kommer, tanken är väl att det här med att hyra in dyra skådisar och annat kommer att försvinna.

Och du nämnde Chatbot GPT, den kommer att integreras i Microsofts sökmotor Bing. Tack för mig, ha det bra! Så att den når ut till alldeles så många människor. Och sen en sak som är jättefascinerande tycker jag, det är att den första A i advokaten träder in i en amerikansk rättssal.

Det ska vara i början av februari ska ett mål avgöras. Där en svarande, inte företrädande, utan advokat kommer att få använda AI. De har tagit fram en speciell liten app du kör i mobilen. Mobilen avlyssnar allt som sägs i rättssalen. Och sen har du en snäcka i örat där du får veta hur du ska svara och säga och så vidare.

Martin

Intressant det här med ljudböckerna tycker jag. Tänk om du applicerar den, den tekniken. på det jag pratade om tidigare i vårt projekt för att transkribera hela Radio Bubblarkivet. Då kan du ju återskapa podcasten med en av de artificiella berättarrösterna.

Boris

Ja, gillar man inte min röst så tar man en annan röst.

Martin

Exakt, man kan få som en egen version när Radio Bubblar säger... Jag tycker att Radio Bubblar är bra, men istället för Martins röst så vill jag alltid höra Björn Ranelids röst. Jag vill höra Santander Nambouris och Björn Ranelid. Eller kan man säga till exempel, jag vill lyssna på Radio Bubblar... Men Boris ska aldrig vara grinig. Han ska alltid vara glad och optimistisk om alla frågor. Och sen vill jag att Martin ska ta varje tillfälle att inflika hur mycket han tycker om marxismen. Och hur stor förklaringsvärde marxismen har. Den versionen av The Bubble vill jag lyssna på. Men det ska låta exakt som Boris röst och Martin röst. Tyvärr så kan man tekniskt göra de här sakerna.

Boris

Ja visst, och man kan fortsätta tala dialekt. Jag slår över i Eskilstuna mål, till exempel. Med västindisk brytning. Alltså, det här kan bli jätteroligt.

Martin

Så, vad händer framöver? A-explosionen kommer fortsätta definitivt. Det kommer en ny version av GPT, GPT4 i år. Det kommer nya versioner av alla de här bildmodellerna. Och det pågår en hel del självreglering. Det pratas en del om hur man begränsar hela tiden GPT, vad den får säga. Åtminstone chatt-GPT, det här gränssnittet, så begränsar man mycket vad den får säga. Den får inte säga politiskt inkorrekta saker och sånt där. Det är mycket självreglering, självcensur.

Och det är tänkt på att det kommer andra typer av regleringar också. Jag tror att vi lite grann just nu upplever... Vi har en bild av västern fas. att vi har mer tillgång till de här verktygen än vi kommer ha på sikt för att man kommer behöva låsa ner det för att det inte är PK och allt det där. Men explosionen kommer, den typen av reglerande processer släpar alltid efter. Det kommer ta ett tag och 2023 kommer det fortsätta vara Vilda Västern.

Och jag tror, alltså det finns det liksom positiva och jag är ganska fokuserad på de positiva aspekterna från dag till dag. Alla nya saker man kan göra med verktygen. Alla nya affärsmöjligheter som öppnar upp sig. Det finns förmodligen väldigt goda möjligheter för nya aktörer att slås in. Open AI har inte gjort en massa fundamentala tekniska innovationer som andra företag inte har tillgång till.

Det är för det är Google som har gjort dem. De har bättre modeller och de har haft dem längre. Det är de som ofta uppfinner de här sakerna och publicerar dem. En myggjörnigt lösning. är ett helt nytt företag som kom från ingenstans. Men det talas om innan jul i år eller förra året och de har en bråkdel av de resurser som OpenAI har. OpenAI ska se. Det är ett. Det är en organisation som startades för sju år sedan och de hade en miljard dollar i startkapital.

Nu, sju år senare, så släpper de Chet GPT. De hade bland annat Elon Musk, Peter Thiel, Microsoft och andra som finansiärer när de startade. Men generellt sett så är det förmodligen inte de stora teknikhjärtorna som Google, Microsoft, Facebook och så vidare som kommer att stå för de stora genombrotten. Kanske på en teknisk nivå, men de är stora.

De är så bundna av sina nuvarande affärsmodeller. AI-revolutionen kommer att skapa helt nya affärsmodeller. Det kommer inte vara att AI-systemen kommer in och ersätter och gör exakt det som någon redan gör, utan det kommer att göra helt nya saker. Det kommer att skapa nya marknader och nya affärsmodeller. Det är nya företag som kommer att kunna utveckla dem, för de existerande företagen är i högre utsträckning så stigbundna.

och det de sysslar med idag. Och det där kommer skapa en massa intressant disruption. Sen har vi förstås de stora hoten som kommer med AI-utvecklingen. På medellång sikt så är AI, enligt min mening, förmodligen det allvarligaste hot som mänskligheten står inför. När vi så småningom kommer till riktig artificiell intelligens, det som ibland kallas för artificiell generell intelligens, då blir det någonting helt annat.

Då tog det inte så kul längre. Snart så kommer vi ha system som är så kraftfulla att människor kommer inte att kunna kontrollera dem. Och de kommer vara så bländande och så frestande och så nyttiga att vi kommer vi kommer inte ha vi kommer inte kunna avhålla oss. Vi kommer inte kunna dra ur stickproppen innan det är för sent.

Den stora utmaningen är att få AI med övermänsklig intelligens och agens. Att agera på ett sätt som är kompatibelt med mänskliga värderingar och mänsklig överlevnad. Tyvärr finns det ingen som vet hur man gör det. Tyvärr är det också så att man troligen inte kan göra försök efter försök efter försök tills man får det rätt. Eventuellt så måste man få det rätt på första försöket.

Första gången man skapar en artificiell generell intelligens som överskrider mänsklig kognitiv kapacitet och påbörjar sin egen utvecklingsprocess genom att utveckla sig själv på sina egna premisser. Eventuellt får vi bara en chans. att skösa ett sådant projekt. Och om vi lyckas med det, då kan det bli en ny guldålder, en ny era i universums utveckling.

Om vi misslyckas så kan mänsklighetens saga vara all snabbare än vi ens hinner märka att en katastrofa är inträffad. Så det är en oerhört fascinerande tid att vara vid liv. Och även om jag känner en stor olust inför riskerna med AGI, och jag tänker mycket på det, mycket mer utifrån dem, så kan jag samtidigt inte hjälpa att vara entusiastisk över många av stegen längs vägen.

Vägen till helvetet är tydligen kantad av oemotståndliga karameller. Och jag kan inte hjälpa att jag bara smaskar i mig och tänker fortsätta göra det.

Boris

Ja, det är just det som är problemet. Om även sådana som du smaskar i sig ur chokladkartongen. Men är det så givet att det innebär en guldolder? Även om det skulle gå rätt i din mening för människan?

Martin

Nej, alltså teoretiskt sett så skulle man kunna tänka sig någon typ av guldold där AI exploderar och tar över men har någon typ av välvillig hjälpande inställning till mänskligheten. Men givetvis, i sätt och vid det du är ute efter, det är många som skulle säga att det är dystopiskt oavsett hur.

Därför att det är någonting som kommer substituera för mänsklig agens. Om vi har artificiell agens och det är inte det som vi vill ha. Vi vill ha mänsklig odling och mänskligt skapande. Om det är någon annan som skapar eller vägleder, stöter det. Det är svårt att se hur människans autonomi och agens och värdighet ska förbli intakt.

Det kommer bli nånting annat. Det kommer bli nånting annat som kanske är bra på sina egna premisser. Som kanske ser bra ut ur backspegeln. Men oavsett så tror jag man kan säga att den mänskliga eran tar slut. Frågan är om människor överhuvudtaget kommer vara med i nästa era. Ja,

Boris

exakt. Men blir det alltså... Är icke-lösningen på detta att man går tillbaka till ett nästan medeltida eller förmedeltida förhållningssätt till det här? Ja, alltså... Det är lätt att ironisera med försöken att begränsa tillgången till det här. Men är inte försöken egentligen att begränsa tillgången väldigt bra? Bör det inte bara vara, som ungefär i förmodern tid, ett prästerskap som har tillgång till de avancerade verktygen?

Faran ligger ju väldigt... Alltså, det är ju dubbla faror. Dels det är lite mer övergripande, som du är inne på. Vad händer när den här görs börjar göra som den vill? Men det andra... På ett annat plan så är det också farad. När AI breder ut så blir all omfattande allmänt tillgänglig. Då accelererar ju fördomningen. Så är det inte lösningen på det här med att äta godis medan man vandrar mot undergången? Alla ska inte ha tillgång till chokladkartongen.

Martin

Jo, det tycker jag är väldigt intressant. Det är en klok tanke. Jag vet inte exakt hur det kan implementeras, men det är en intressant sak i det sammanhanget. Jag vet inte om du känner till det Boris, men OpenAI är en organisation som har grundats till att man ska kunna använda chokladkartongen. av liksom Elon Musk och Sam Altman och några till på den explicita premissen att göra exakt motsatsen till det som du pratar om nu.

Boris

Ja, det är det som är förståeligt.

Martin

För då säger du att AI kan kanske inte kontrolleras, vi vet inte exakt vart det är vägen. Men en sak som vi kan göra åtminstone är att se till att AI inte blir ojämnt fördelat. Det vill säga att var det än blir så får alla tillgång till det. Så att det inte bildas klickar av människor som har AI och som blir väldigt dominerande. En underklass som inte har AI som handlar för efterkälken. Så att det finns en sorts ultra-egalitär idé bakom hela OpenAI-projektet som Elon Musk-uttrycken har argumenterat för.

Han är ju, du vet, jag beundrar Jonas mycket på vissa sätt, men... Eller jag uppskattar honom väldigt mycket, men inte under, jag uppskattar honom väldigt mycket. Men intellektuellt och filosofiskt så är han ju en katastrof. I kombination med hur mycket inflytande pengar han har så blir det ju verkligen katastrof ibland. Det var bara en liten parentes där om A,B,D,A. Det är en väldigt klok idé du har. Frågan är hur man skulle åstadkomma den här isoleringen av A i vissa små grupper. Det finns ju, jag vet inte om du läste den någon gång Boris, men det finns ju en bok, en roman av Nils Stivensson som heter Anathem, som utforskar lite grann. Kommer du ihåg den?

Boris

Ja, du skickade den till mig just nu. Just det. Det är den som har puttrat dig. i bakhuvudet på mig förstås.

Martin

Det är i alla fall en liknande idé där. Du har ett massamhälle som har supermycket teknologi som människor absolut inte förstår men som de är helt beroende av och helt i symbios med. Och sen har man små, små kloster ungefär där människor lever på ett annat sätt och inte är förslavade under all den här teknologin.

Det är en väldigt fascinerande idé om om hur man skulle åstadkomma sån här... Jag själv är ganska positiv till en mer... att utforska en mer sån här ludditisk... Jag har pratat tidigare om att man kanske skulle vilja släppa loss staten och statens regleringsapparat på allt vad AI heter, bara för att sakta ner utvecklingen. För att staten är så usla på att reglera saker, så då fastnar allting i ett träsk, en tjock gröt av statliga regleringar.

Problemet med det är att det går inte att göra globalt. Kinesiska AI-forskare kommer inte att saknas ner av amerikanska regleringar av AI. Man kan också tänka sig en mer generell rörelse. Det finns en annan science fiction roman som heter Dune. Där finns det en historisk händelse som beskrivs. som är ett globalt eller kosmiskt uppror mot AI.

De kallas för The Battlerian Jihad, tror jag det kallas i Dune. Det är som ett stort krig, en omvälvning, där man går till krig mot tänkande maskiner. Sen instiftar man ett fördrag som gäller för alla världar, att ingen får bygga sådana här tekniker igen. Så någonting av det hållet skulle man kunna tänka sig att man bara total förbjuder. den här typen av saker. I så fall så skulle jag säga att chat, GPT och allt det där, mid-journey, är långt över gränsen för vad som borde vara tillåtet om man ska ha en försiktighetsprincip och kväsan i utvecklingen.

Men återigen, väldigt svårt att implementera generellt och problemet är att det räcker med att en grupp, ett land någonstans eller bara en forskargrupp, är fria att fortsätta med det här för att det ska kunna bli väldigt, väldigt problematiskt. Så den allra mördiga som... Det finns en term som används som är Pivotal Act.

Det är en catchphrase för en idé att det är något i stil med att det första som en övermänsklig, artificiell, generell intelligens bör göra. Det man helst skulle vilja att AI gör, som sin första åtgärd, är att omedelbart förhindra att någon annan artificiell generell intelligens kan uppstå.

Så att gripa in och stoppa alla AI-projekt från att skapa en till AI, så att det bara finns en. Och det skulle man kunna tänka sig eventuellt, man kan leka med den tanken i alla fall, att det uppstår en sån här nästan gudomligt övermäktig AI, men den är programmerad på ett sånt sätt att det enda den gör är att... vaka över världen och se till att det aldrig skapas ett till AI. Att alla sådana försök kväses. Och i övrigt så kanske den inte gör någonting.

Boris

Det är en ganska tilltanande idé.

Martin

Det är en elegant lösning på problemet. Om det nu är möjligt, det är en teknisk fråga delvis. Men... Det är fascinerande, skrämmande och fascinerande att tänka på. Men jag för min del, jag ska villigt erkänna att jag har för avsikt att spela fiol mellan rombrinner och leka med de här AI-systemen trots att jag tror att de mycket väl kan bli vår undergång.