Vis maskinen hvem som er sjefen

«Kjære leser, tenk deg å våkne opp en dag og oppdage at du har blitt overgått av en maskin! Vel, dette er ikke lenger science fiction, men realiteten i verden av AI og maskinlæring. Men frykt ikke, vi er her for å holde deg oppdatert på alt som rører seg i denne spennende bransjen, og kanskje lære deg noen triks så du kan vise maskinene hvem som er sjefen!»

– Chat-GPT

Ja, hvorfor skal jeg egentlig skrive dette selv lenger når maskinen gjør en like god jobb?
Kan AI ta jobben din?

Dette spørsmålet kommer stadig opp. Og for stadig fler yrker er vel svaret ja. Forskere har selvsagt stilt seg dette spørsmålet, og har latt Chat-GPT prøve seg på diverse profesjonseksamener. For eksempel, kan det klare kvalifikasjonsprøvene til å bli lege? I USA må man gjennom tre tester (i tillegg til utdannelse), og Chat-GPT passerte eller kom svært nær på alle tre nivåene. Hva med advokat? Joa, Chat-GPT besto den såkalte «Bar-Exam» som de aller fleste stedene i USA krever for at man skal kunne kalle seg advokat. Så lege og advokat er innenfor? En dommer brukte forøvrig også Chat-GPT til å dømme i en rettssak, og den første rettssak der AI skal stå for hele saken, er berammet denne måneden. En AI skal fortelle den tiltalte akkurat hva vedkommende skal si gjennom en mobiltelefon. Så kom protestene, og vedkommende ble truet med opptil 6 måneders fengsel, da han ville «praktisere jus uten godkjennelse».

Hva med en MBA fra en av de aller mest respekterte universitetene? Wharton rangeres stadig blant de beste. Og ja, Chat-GPT klarte visst også fint eksamen i «Operations Management» som er et av kursene alle må igjennom. 

Det har også blitt forsket på hvordan Chat GPT kan forbedre kode, og den besto faktisk Amazons tekniske intervjuspørsmål.

Når det er sagt, så ble forskerene overrasket over hvilke feil som ble gjort. Chat-GPT bommet på det som defineres som matte for 6-klassinger og problemstillinger der det er flere problemstillinger vevd sammen. Så det betyr vel at de fleste av oss enda ikke ligger ann til å bli erstattet riktig enda. Med mindre du er designer. Da ligger du muligens tynt ann. MIT og The Atlantic har forøvrig også sine synspunkter.
EU og USA med stor ny avtale om AI

EU og USA har tidligere også inngått avtaler vedrørende AI, men da har disse vært begrenset til gitte områder, som for eksempel rundt privat informasjon. Nå har de inngått en mer overgripende avtale som har målsetning om å sammen kunne bygge modeller, men at data fremdeles forblir i de respektive regionene. For eksempel, maskinlæring brukes for å regulere el-kraftdistribusjon, slik at ikke værforhold skaper nedetid. Mange land lager slike modeller. Nå skal det bygges felles modeller som inkluderer alle landenes data.

EU er forøvrig i gang med flere regler rundt AI, som blant annet fryktes at kan spenne ben på open-source miljøet. GitHubs CEO Thomas Dohmke er ikke like pessimistisk. Og godt er det. Ellers kunne vel GitHub ha lagt ned? EU har forøvrig kommet med en rapport om hvordan nye AI-regler kan påvirke start-ups i EU, hvis ikke toget allerede har forlatt perrongen allerede vel og merke. 

Når vi er inne på temaet AI og Europa, så skal som mange har fått med seg, så er det OL i Paris neste år. Så hva er vel mer naturlig enn å «fast-tracke» lovverk som skal godkjenne svært omfattende AI-basert overvåking?




Kina har visst fremdeles verdensrekorden med mer enn 60 kameraer på en kort veistump. Etter dette gikk viralt har visst en del av disse kameraene forsvunnet. 
Maskinlæring har blitt juksernes beste venn?

Chat-GPT har ikke uventet blitt brukt til en mengde forskjellige oppgaver, hvorav juksing med skoleoppgaver nok er en av disse. Det er flere programvarer som påstår å skulle kunne gjennomskue dette. Til og med OpenAI har laget en versjon

Grunnen til at vi inkluderer dette her, er for å advare om det som står med liten skrift. Denne klarer positivt å identifisere 26 % av AI-skrevet tekst, mens 9 % av det et menneske har skrevet blir falsk klassifisert som AI-tekst. Systemet er trent på 34 forskjellige tekstgenereringssystemer fra 5 forskjellige selskap. Treffsikkerheten betyr imidlertid at man like gjerne kan slå kron eller mynt. Så om du er foreldre eller lærer; la like gjerne denne typen verktøy forbli ubrukt inntil videre. OpenAIs CTO Mira Murati mener forøvrig at Chat-GPT (og lignende teknologi) vil kunne revolusjonere måten vi lærer på.  Elevene vil kunne spørre og grave om temaer vedkommende ikke forstår, og få det forklart på et utallig antall måter på vedkommendes eget nivå. Det finnes forøvrig muligheter for å få evaluert resultatet fortløpende.



Når vi er inne på juks, så har også en rekke nyhetsmedier begynt å publisere artikler skrevet av maskinlæring. Buzzfeeds aksje hoppet 200% da de annonserte dette. En av de det ikke gikk like bra med er  IT-tidsskriftet CNET. Det gikk forøvrig helt fint til det ble oppdaget. Da var det visst kvaliteten det var noe i veien med. Protestene og ramaskrik fra alle kanter var ikke en del av beslutningen. Verktøyet takket for den lærerike og spennende tiden og sa i en uttalelse at «nå skulle det tilbringe mer tid med familien».

Netflix gikk i samme PR-felle, da de brukte AI til å generere anime. Netflix sier de brukte det da det ikke er nok tegnere å oppdrive. Fansen, eller var det tegnernes fagforening, kjøper ikke dette
Tom Hanks skal spille Tom Hanks den yngre

Russerne har som vi tidligere omtalte, spilt inn komiserier med amerikanske skuespillere som ikke engang visste de var med i serien. I Storbritannia skal ITV produsere en ny tv-serie med Deepfakes. Nå skal Miramax lansere en spillefilm hvor Tom Hanks spiller Tom Hanks. Ja, da en yngre versjon av Tom Hanks. Det neste blir vel å leie inn «Kåre Hanks» som da kan spille dagens Tom Hanks, men da bare til en brøkdel av kostnaden. Men det ville vel skapt litt for mye rabalder. Det får holde med den russiske Keanu Reeves.
Tar robotene over verden?

Litt på siden av hva vi pleier å skrive om, men fremdeles interessant. Investeringene i oppstartsselskaper innenfor roboter er opp 7.7% i desember 2022 i forhold til året før. Opp til 1.14 milliarder dollar, og det i et investormarked som for mange føltes ut som om det traff veggen.

Når vi er inne på roboter; de fleste har vel fått med denne videoen over hvor mye robotene klarer på en (lab) byggeplass. Her er noen bloopers. Roboten bommer visst av og til den også. Nå har det også kommet en robot som kan lukte som en hund. Merk, ikke lukte som en våt hund, men ha luktesansen til en hund. Så hva er vel poenget med å dra til flyplassen lenger da, om man ikke lenger får se en søt bombe- eller narkohund som gjør jobben sin? En luktende robot? Nei og nei… Da er det bedre å dra på stranden å løpe og leke med en hund. Det har visst kommet en robothund som kan løpe 3m i sekundet i dyp sand også. Så så mye for den ideen.

Eller hva med en flyvende robot som veier 1.2 milligram og som bruker lys og vind for energi. Kan for eksempel brukes til polynering av planter. Ikke nok med at robotene skal ta fra folk jobbene. Nå skal de ta jobbene fra biene også?
Eller er det advokatene som tar over?

De store datamodellene trenes selvsagt på et stort materiale. Og dette materialet er det ikke maskinlæringsselskapene som genererer. Ok, av og til trenes modeller på simulerte data, men det er ikke det vi snakker om nå. De store språkmodellene er gjerne trent på nettinnhold mens bildemodellene er trent på bildedatabasene som finnes tilgjengelig. 



Disse datasettene er det da noen andre som eier, og følgelig vil ha betalt for. Getty har igjen saksøkt Stability AI som står bak Stable Diffusion. De har visst til og med sett eksempler på at programvaren har generert bilder med en avart av Gettys vannmerke, Noen har faktisk gått igjennom 12 millioner av de 2.3 milliarder bildene som er brukt til trening, og funnet mer enn 15000 fra Getty. 

Microsoft, GitHub og OpenAI er også saksøkt i et massesøksmål fordi deres tjeneste CoPilot, som bistår utviklere å skrive kode, er trent på milliarder av kodelinjer uten at noen har gitt tillatelse til dette. 

Det samme gjelder selvsagt også Midjourney. Som her, hvor Midjourney til og med la til en slags signatur, som med stor sannsynlighet kommer fra en av verkene den er trent på.


Her fra Stable Diffusion. Bildene øverst er generert av Stable Diffusion basert på en tekstbeskrivelse. De nederste bildene er tilsvarende søkt frem i en søkemotor. Ingen tvil om at det er en viss likhet. Har du forresten lyst på din egen implementasjon av Stable Diffusion, så klikk her
Stable Diffusion copying

Her er forøvrig en tjeneste hvor man kan laste opp et bilde som er generert av AI, for så å få tjenesten til å identifisere hvilke bilder dette er basert på. 

Forskere har faktisk funnet at mye av de portrettene osv. som vi har fått presentert i media som AI-genererte faktisk ikke egentlig er det, da de i litt for stor grad er basert på enkeltpersoner fra treningsmaterialet.
Dobling av AI-hastighet på en svært enkel måte

DeepMind (som er Googles OpenAI-konkurrent) snublet over, eller kanskje rett og slett faktisk prøvde en rekke forskjellige metoder, og fant frem til en måte de kan doble hastigheten på uttrekk fra store språkmodeller. De har oppnådd en økning på 2-2.5x på modell med 70 milliarder parametere. Trikset er å bruke en liten modell først for å hente ut svar, og deretter benytte en mer kompleks modell for å score dette svaret. Fremgangsmåten kan brukes i mange sammenhenger, og kan både gjøre AI raskere og billigere. Les mer her. De er visst ikke de eneste. Her er det noen som kan skilte med 40x lavere ressursbruk.

Google har forøvrig blitt veldig stresset av Chat-GPTs suksess og har sagt at de vil lansere sin konkurrent i løpet av året. Baidu kommer også med sin konkurrent i mars, som vil hete Ernie, og Alibaba har også kastet seg på. Det betyr vel at visse ministere ikke trenger å utelukkende basere seg på at kineserne får innsikt i regjeringens arbeid kun gjennom TikTok lenger. Nå blir det flere muligheter til å dele data. Regjeringen har forøvrig, ved Mehl, besluttet at TikTok ikke skal forbys på regjeringstelefoner, til tross for at den sannsynligvis inneholder en keylogger. The Economist skriver forøvrig om «The race of the AI labs» her (betalingsmur), som forklarer på typisk The Economist-vis hva som skjer.

Teksten ovenfor ble forøvrig skrevet for noen dager siden, og ting skjer fort. Så Google har nå kastet seg rundt og lansert Bard, basert på selskapets LaMDA (Language Model for Dialogue Applications), som er en av Googles største språkmodeller. Denne ble forøvrig oppfattet som en stor skuffelse i markedet, og Googles aksje falt tilsvarende 100 milliarder USD, som forøvrig tilsvarer Equinors verdi, i timene etter lansering. Den falt ytterligere 50 milliarder USD dagen etter, og vipps så var Telenor, Yara, DNB samt Hydro borte. Det tok forøvrig ikke mange timene før artiklene om at Google snart er et fallert selskap ble skrevet. Kan vel være litt tidlig å avskrive de helt enda? 
Utviklingen går fort

Det amerikanske forsvaret har noen av verdens største forskningsbudsjetter og står bak mye av det vi i dag tar som selvfølgeligheter i våre liv. ARPANET ble til dagens internett. Digital foto ble utviklet på 60-tallet for spionsatellitter, våtservietter til sårbehandling, teflon osv. Nå har det imidlertid skjedd et skift. Ett 2-milliarders forskningsprosjekt for autonome undervannsdroner har blitt stoppet. Kommersielle alternativer har gått forbi, og det er dermed bare tull å bruke skattebetalernes penger på dette. Denne beslutningen burde definitivt være en inspirasjon både for noen og enhver, også her hjemme, eller kanskje rettere sagt spesielt her hjemme. 
Hva skjedde med OpenAI? Ikke lenger non-profit?  

OpenAI har vært i vinden de siste månedene. Man kan vel ikke ha åpnet en avis uten å ha sett hvordan GPT-3 har endret verden. Det har også kommet meldinger om at Microsoft har kjøpt seg opp. Men OpenAI skulle jo være en non-profit? Iallefall var vel det tanken når Elon Musk og co satte igang i 2015. (Ja, Musk hadde en finger med i spillet her også, og gikk inn med penger i første runde. Satt i styret frem til 2018. Her er forøvrig et bra intervju med Sam Altman, selskapets CIO (betalingsmur)). Så hva er greia med Microsoft og aksjekjøp?

Microsoft gikk inn med $1 milliard i 2019, $2 milliarder i 2021 og nye $10 milliarder nå i en verdsettelse på $29 milliarder. Avtalen sier videre at Microsoft skal få 75% av utbyttet inntil de har fått tilbake pengene sine. Deretter vil MS ende opp med en eierandel på 49 %. Andre eiere vil også sitte med 49 %, og OpenAIs non-profit sitte igjen med 2 %. 

Microsoft er forøvrig igang med å rulle ut Chat-GPT i sine tjenester. Både den og Dall-E 2 er tilgjengelige på Azure. Microsoft skulle opprinnelig relansere Bing i mars, basert på Chat-GPT 4 (og ikke 3 som er tilgjengelig i dag), men har allerede lansert en tidlig versjon.


Her er forøvrig Microsofts offisielle tidslinje for sitt AI-arbeid. Og som den observante leser vil se, så er det stort sett OpenAI som står bak det meste:


OpenAI har forøvrig fått kritikk for å bruke Kenyanske arbeidere som fikk betalt mellom 10 og 20 kroner per time for å «sensurere» Chat-GPT. Med andre ord, sørge for å filtrere bort de svarene som gjør seg minst på trykk. Arbeidsmiljøet var vel heller ikke all verden å skryte av. PTSD faktisk? Det må virkelig ha vært noe å ta tak i. Det er forøvrig mulig å «jail-breake» Chat-GPT for å komme seg rundt disse sperrene. Evt. spørre på en litt annen måte om du vil.

Image

OpenAI har forøvrig også leid inn mer enn 1000 personer i Sør-Amerika og Øst-Europa hvorav 600 skal jobbe med klassifisering av materiale som kan brukes blant annet for selvkjørende biler, mens 400 er utviklere som skal skrive kode som kan brukes til å trene deres produkt for utvikling av utviklerkode.

Uansett, de kan iallefall trøste seg med å være det produktet som raskest nådde 100 millioner brukere. Tok to måneder. TikTok hadde den forrige rekorden på 9 måneder, mens Instagram hadde den før det igjen med 2 1/2 år.

Det har forøvrig allerede begynt å poppe opp et helt øko-system av gode implementasjoner. Ta for eksempel en titt her (kode), her eller her for noen tilsvarende tjenester som fokuserer på reise. Slik finnes det implementasjoner innen de aller fleste temaer og jeg måtte dessverre begrense meg til et tilfeldig ett. Ellers ville dette nyhetsbrevet blitt fryktelig langt.
Mer enn 520 algoritmer er godkjent for medisinsk arbeid av FDA

Legemiddelindustrien og helsesektoren er blant de som har virkelig hatt mye positiv effekt av maskinlæring. Det gjøres for eksempel knapt fremskritt innenfor kreftforskningen som ikke i stor grad er basert på maskinlæring. Siste opptelling nå er at FDA har godkjent 520 algoritmer. En av disse kan hjelpe deg å slutte å røyke
It’s all fun and games – Litt diverse tidsfordriv

For deg som ikke kan få nok av Seinfeld, så genereres det nå en uendelig strøm av Seinfeld-innhold her. Eller rettere sagt, det ble generert nytt innhold 24/7 siden 14. desember, inntil karakteren Jerry gikk litt utenfor hva som regnes som politisk korrekt. Showet er nå stoppet i 14 dager.  

Maskinlæring har dekryptert et 400 år gammelt brev fra «Mary, Skottenes dronning», som har vært en utfordring for historikere siden hun ble halshugd i 1587. 

Chat-GPT har mange gode siden, men har nå hatt sine utfordringer og det har vært rapportert en del spinnville svar. Her er de største tabbene samlet.

Her er et lite quiz-spørsmål: Når ble neurale nett oppfunnet, eller sagt på en annen måte, hvor langt tilbake må vi for å finne de første stegene som ble til neurale nett? Svarte du 1943, så får du full pott. Ellers bør du kanskje lese «A Brief History of Neural Nets». Om du heller vil lese bakgrunnshistorien for de nye språkmodellene, så finner du den her eventuelt en leseliste her. Blir det for lite ambisiøst, og du vil lære hele historien om AI? Ja, da må du nok belage deg på noen års studier. Om du imidlertid kun har 10 minutter, så kan du gå hit.

Lyst til å bli en suksessrik barnebokforfatter med null innsats? Automatiser historieskrivingen med et AI-verktøy (ja, du kan sikkert gjette hvilke som kan bistå deg) og les her hvordan det kan autogenereres bilder som settes sammen til en bildebok. Muligens jeg er litt gammeldags som tror barn fremdeles leser bøker. Så kanskje heller få autogenerte filmer? Kan det bli enklere?

Har du forøvrig fått deg en wifi-tilkoblet brødrister? Hvis ikke, så kan livet ditt umulig være komplett. Eller? Mindre enn 50 % av alle smart-enheter er faktisk koblet til nettet. Så kanskje det ikke er helt kritisk alikevel?
Litt tekniske nyheter helt til slutt…

TensorFlow var lenge det ledende verktøyet for bygging av neurale nett. PyTorch tok vel over stafettpinnen rundt 2019 eller noe der omkring. Siden forrige nyhetsbrev har PyTorch hatt sin årlige konferanse med flere nyheter. Da ble PyTorch 2.0 annonsert. API vil ikke endres men det kommer mange effektivitetsforbedringer. En del av kodebasen vil bli endret fra C++ til Python for å gjøre det enda mer brukervennlig. Grafer kan kompileres med torch.compile. PyTorch kan forøvrig fremdeles brukes i eager mode. Lovely tensors er et nytt bibliotek som vil gjøre debugging lettere. Jupyter Notebooks får også endelig multi-GPU støtte. Og har du ikke helt fått dreisen på Pandas enda? Da kan du gå hitBert er forøvrig et svært sentralt verktøy innen NLP. Visste du at man kan bruke Bert med Convolutional Networks også? Og om heller tidsserier er din greie, så ta en titt her.

Her er forøvrig Chat-GPTs svar til alle spørsmål på StackOverflow. Også de uten andre besvarelser. Og ønsker du å tune den til ditt innhold, da kan du starte her og fortsette her. Skal du forøvrig bruke Chat-GPT i egen kode, så kan det være en ide med en tracker så ikke eventuelt kostnader skal gå helt amok. Om OpenAI går amok når noen har funnet et smutthull til å kunne implementere ChatGPT gjennom Docker på egen maskin, skal jeg ikke spekulere i. Men om du har Docker installert, kan du laste ned containeren og prøve her. Og når du først er igang, så kan du nå få NLP i SQL eller rett og slett erstatte en SQL-analytiker med 26 Chat-GPT kommandoer. 

Og der tror jeg vi setter strek for denne gangen. Det ble veldig mye Chat GPT denne gangen. Litt for mye vil kanskje noen si. Men interessen for dette temaet har eksplodert de siste ukene, og som en lettpåvirkelig sjel lar jeg meg selvsagt rive med. Men det er det slutt på fra og med neste nyhetsbrev. Da skal alt bli så mye bedre. Blir det ikke det, så lar jeg AI skrive hele brevet. For AI er jo alltid helt nøytralt. For det sier iallefall AIen selv. Og som jeg har lært fra barnsben, står det i avisen, eller internett som det idag heter, så er det jo alltid sant.


Med vennlig hilsen,
Øyvind Dale Spørck

oeyvind@sannsyn.com
Mobil: 92 444 777
Sannsyn AS
Har du fått tilsendt dette nyhetsbrevet, og gjerne vil ha det direkte? Da er det bare å hoppe over hit, så slipper du å gå glipp av noe som helst
Har du forøvrig ikke sett videoen vår enda, så gjør det nå. Under 2 min, og faktisk ganske morsom om jeg skal si det selv.