Vis maskinen hvem som er sjefen

«Kjære leser, tenk deg å våkne opp en dag og oppdage at du har blitt overgått av en maskin! Vel, dette er ikke lenger science fiction, men realiteten i verden av AI og maskinlæring. Men frykt ikke, vi er her for å holde deg oppdatert på alt som rører seg i denne spennende bransjen, og kanskje lære deg noen triks så du kan vise maskinene hvem som er sjefen!»

– Chat-GPT

Ja, hvorfor skal jeg egentlig skrive dette selv lenger når maskinen gjør en like god jobb?
Kan AI ta jobben din?

Dette spørsmålet kommer stadig opp. Og for stadig fler yrker er vel svaret ja. Forskere har selvsagt stilt seg dette spørsmålet, og har latt Chat-GPT prøve seg på diverse profesjonseksamener. For eksempel, kan det klare kvalifikasjonsprøvene til å bli lege? I USA må man gjennom tre tester (i tillegg til utdannelse), og Chat-GPT passerte eller kom svært nær på alle tre nivåene. Hva med advokat? Joa, Chat-GPT besto den såkalte «Bar-Exam» som de aller fleste stedene i USA krever for at man skal kunne kalle seg advokat. Så lege og advokat er innenfor? En dommer brukte forøvrig også Chat-GPT til å dømme i en rettssak, og den første rettssak der AI skal stå for hele saken, er berammet denne måneden. En AI skal fortelle den tiltalte akkurat hva vedkommende skal si gjennom en mobiltelefon. Så kom protestene, og vedkommende ble truet med opptil 6 måneders fengsel, da han ville «praktisere jus uten godkjennelse».

Hva med en MBA fra en av de aller mest respekterte universitetene? Wharton rangeres stadig blant de beste. Og ja, Chat-GPT klarte visst også fint eksamen i «Operations Management» som er et av kursene alle må igjennom. 

Det har også blitt forsket på hvordan Chat GPT kan forbedre kode, og den besto faktisk Amazons tekniske intervjuspørsmål.

Når det er sagt, så ble forskerene overrasket over hvilke feil som ble gjort. Chat-GPT bommet på det som defineres som matte for 6-klassinger og problemstillinger der det er flere problemstillinger vevd sammen. Så det betyr vel at de fleste av oss enda ikke ligger ann til å bli erstattet riktig enda. Med mindre du er designer. Da ligger du muligens tynt ann. MIT og The Atlantic har forøvrig også sine synspunkter.
EU og USA med stor ny avtale om AI

EU og USA har tidligere også inngått avtaler vedrørende AI, men da har disse vært begrenset til gitte områder, som for eksempel rundt privat informasjon. Nå har de inngått en mer overgripende avtale som har målsetning om å sammen kunne bygge modeller, men at data fremdeles forblir i de respektive regionene. For eksempel, maskinlæring brukes for å regulere el-kraftdistribusjon, slik at ikke værforhold skaper nedetid. Mange land lager slike modeller. Nå skal det bygges felles modeller som inkluderer alle landenes data.

EU er forøvrig i gang med flere regler rundt AI, som blant annet fryktes at kan spenne ben på open-source miljøet. GitHubs CEO Thomas Dohmke er ikke like pessimistisk. Og godt er det. Ellers kunne vel GitHub ha lagt ned? EU har forøvrig kommet med en rapport om hvordan nye AI-regler kan påvirke start-ups i EU, hvis ikke toget allerede har forlatt perrongen allerede vel og merke. 

Når vi er inne på temaet AI og Europa, så skal som mange har fått med seg, så er det OL i Paris neste år. Så hva er vel mer naturlig enn å «fast-tracke» lovverk som skal godkjenne svært omfattende AI-basert overvåking?




Kina har visst fremdeles verdensrekorden med mer enn 60 kameraer på en kort veistump. Etter dette gikk viralt har visst en del av disse kameraene forsvunnet. 
Maskinlæring har blitt juksernes beste venn?

Chat-GPT har ikke uventet blitt brukt til en mengde forskjellige oppgaver, hvorav juksing med skoleoppgaver nok er en av disse. Det er flere programvarer som påstår å skulle kunne gjennomskue dette. Til og med OpenAI har laget en versjon

Grunnen til at vi inkluderer dette her, er for å advare om det som står med liten skrift. Denne klarer positivt å identifisere 26 % av AI-skrevet tekst, mens 9 % av det et menneske har skrevet blir falsk klassifisert som AI-tekst. Systemet er trent på 34 forskjellige tekstgenereringssystemer fra 5 forskjellige selskap. Treffsikkerheten betyr imidlertid at man like gjerne kan slå kron eller mynt. Så om du er foreldre eller lærer; la like gjerne denne typen verktøy forbli ubrukt inntil videre. OpenAIs CTO Mira Murati mener forøvrig at Chat-GPT (og lignende teknologi) vil kunne revolusjonere måten vi lærer på.  Elevene vil kunne spørre og grave om temaer vedkommende ikke forstår, og få det forklart på et utallig antall måter på vedkommendes eget nivå. Det finnes forøvrig muligheter for å få evaluert resultatet fortløpende.



Når vi er inne på juks, så har også en rekke nyhetsmedier begynt å publisere artikler skrevet av maskinlæring. Buzzfeeds aksje hoppet 200% da de annonserte dette. En av de det ikke gikk like bra med er  IT-tidsskriftet CNET. Det gikk forøvrig helt fint til det ble oppdaget. Da var det visst kvaliteten det var noe i veien med. Protestene og ramaskrik fra alle kanter var ikke en del av beslutningen. Verktøyet takket for den lærerike og spennende tiden og sa i en uttalelse at «nå skulle det tilbringe mer tid med familien».

Netflix gikk i samme PR-felle, da de brukte AI til å generere anime. Netflix sier de brukte det da det ikke er nok tegnere å oppdrive. Fansen, eller var det tegnernes fagforening, kjøper ikke dette
Tom Hanks skal spille Tom Hanks den yngre

Russerne har som vi tidligere omtalte, spilt inn komiserier med amerikanske skuespillere som ikke engang visste de var med i serien. I Storbritannia skal ITV produsere en ny tv-serie med Deepfakes. Nå skal Miramax lansere en spillefilm hvor Tom Hanks spiller Tom Hanks. Ja, da en yngre versjon av Tom Hanks. Det neste blir vel å leie inn «Kåre Hanks» som da kan spille dagens Tom Hanks, men da bare til en brøkdel av kostnaden. Men det ville vel skapt litt for mye rabalder. Det får holde med den russiske Keanu Reeves.
Tar robotene over verden?

Litt på siden av hva vi pleier å skrive om, men fremdeles interessant. Investeringene i oppstartsselskaper innenfor roboter er opp 7.7% i desember 2022 i forhold til året før. Opp til 1.14 milliarder dollar, og det i et investormarked som for mange føltes ut som om det traff veggen.

Når vi er inne på roboter; de fleste har vel fått med denne videoen over hvor mye robotene klarer på en (lab) byggeplass. Her er noen bloopers. Roboten bommer visst av og til den også. Nå har det også kommet en robot som kan lukte som en hund. Merk, ikke lukte som en våt hund, men ha luktesansen til en hund. Så hva er vel poenget med å dra til flyplassen lenger da, om man ikke lenger får se en søt bombe- eller narkohund som gjør jobben sin? En luktende robot? Nei og nei… Da er det bedre å dra på stranden å løpe og leke med en hund. Det har visst kommet en robothund som kan løpe 3m i sekundet i dyp sand også. Så så mye for den ideen.

Eller hva med en flyvende robot som veier 1.2 milligram og som bruker lys og vind for energi. Kan for eksempel brukes til polynering av planter. Ikke nok med at robotene skal ta fra folk jobbene. Nå skal de ta jobbene fra biene også?
Eller er det advokatene som tar over?

De store datamodellene trenes selvsagt på et stort materiale. Og dette materialet er det ikke maskinlæringsselskapene som genererer. Ok, av og til trenes modeller på simulerte data, men det er ikke det vi snakker om nå. De store språkmodellene er gjerne trent på nettinnhold mens bildemodellene er trent på bildedatabasene som finnes tilgjengelig. 



Disse datasettene er det da noen andre som eier, og følgelig vil ha betalt for. Getty har igjen saksøkt Stability AI som står bak Stable Diffusion. De har visst til og med sett eksempler på at programvaren har generert bilder med en avart av Gettys vannmerke, Noen har faktisk gått igjennom 12 millioner av de 2.3 milliarder bildene som er brukt til trening, og funnet mer enn 15000 fra Getty. 

Microsoft, GitHub og OpenAI er også saksøkt i et massesøksmål fordi deres tjeneste CoPilot, som bistår utviklere å skrive kode, er trent på milliarder av kodelinjer uten at noen har gitt tillatelse til dette. 

Det samme gjelder selvsagt også Midjourney. Som her, hvor Midjourney til og med la til en slags signatur, som med stor sannsynlighet kommer fra en av verkene den er trent på.


Her fra Stable Diffusion. Bildene øverst er generert av Stable Diffusion basert på en tekstbeskrivelse. De nederste bildene er tilsvarende søkt frem i en søkemotor. Ingen tvil om at det er en viss likhet. Har du forresten lyst på din egen implementasjon av Stable Diffusion, så klikk her
Stable Diffusion copying

Her er forøvrig en tjeneste hvor man kan laste opp et bilde som er generert av AI, for så å få tjenesten til å identifisere hvilke bilder dette er basert på. 

Forskere har faktisk funnet at mye av de portrettene osv. som vi har fått presentert i media som AI-genererte faktisk ikke egentlig er det, da de i litt for stor grad er basert på enkeltpersoner fra treningsmaterialet.
Dobling av AI-hastighet på en svært enkel måte

DeepMind (som er Googles OpenAI-konkurrent) snublet over, eller kanskje rett og slett faktisk prøvde en rekke forskjellige metoder, og fant frem til en måte de kan doble hastigheten på uttrekk fra store språkmodeller. De har oppnådd en økning på 2-2.5x på modell med 70 milliarder parametere. Trikset er å bruke en liten modell først for å hente ut svar, og deretter benytte en mer kompleks modell for å score dette svaret. Fremgangsmåten kan brukes i mange sammenhenger, og kan både gjøre AI raskere og billigere. Les mer her. De er visst ikke de eneste. Her er det noen som kan skilte med 40x lavere ressursbruk.

Google har forøvrig blitt veldig stresset av Chat-GPTs suksess og har sagt at de vil lansere sin konkurrent i løpet av året. Baidu kommer også med sin konkurrent i mars, som vil hete Ernie, og Alibaba har også kastet seg på. Det betyr vel at visse ministere ikke trenger å utelukkende basere seg på at kineserne får innsikt i regjeringens arbeid kun gjennom TikTok lenger. Nå blir det flere muligheter til å dele data. Regjeringen har forøvrig, ved Mehl, besluttet at TikTok ikke skal forbys på regjeringstelefoner, til tross for at den sannsynligvis inneholder en keylogger. The Economist skriver forøvrig om «The race of the AI labs» her (betalingsmur), som forklarer på typisk The Economist-vis hva som skjer.

Teksten ovenfor ble forøvrig skrevet for noen dager siden, og ting skjer fort. Så Google har nå kastet seg rundt og lansert Bard, basert på selskapets LaMDA (Language Model for Dialogue Applications), som er en av Googles største språkmodeller. Denne ble forøvrig oppfattet som en stor skuffelse i markedet, og Googles aksje falt tilsvarende 100 milliarder USD, som forøvrig tilsvarer Equinors verdi, i timene etter lansering. Den falt ytterligere 50 milliarder USD dagen etter, og vipps så var Telenor, Yara, DNB samt Hydro borte. Det tok forøvrig ikke mange timene før artiklene om at Google snart er et fallert selskap ble skrevet. Kan vel være litt tidlig å avskrive de helt enda? 
Utviklingen går fort

Det amerikanske forsvaret har noen av verdens største forskningsbudsjetter og står bak mye av det vi i dag tar som selvfølgeligheter i våre liv. ARPANET ble til dagens internett. Digital foto ble utviklet på 60-tallet for spionsatellitter, våtservietter til sårbehandling, teflon osv. Nå har det imidlertid skjedd et skift. Ett 2-milliarders forskningsprosjekt for autonome undervannsdroner har blitt stoppet. Kommersielle alternativer har gått forbi, og det er dermed bare tull å bruke skattebetalernes penger på dette. Denne beslutningen burde definitivt være en inspirasjon både for noen og enhver, også her hjemme, eller kanskje rettere sagt spesielt her hjemme. 
Hva skjedde med OpenAI? Ikke lenger non-profit?  

OpenAI har vært i vinden de siste månedene. Man kan vel ikke ha åpnet en avis uten å ha sett hvordan GPT-3 har endret verden. Det har også kommet meldinger om at Microsoft har kjøpt seg opp. Men OpenAI skulle jo være en non-profit? Iallefall var vel det tanken når Elon Musk og co satte igang i 2015. (Ja, Musk hadde en finger med i spillet her også, og gikk inn med penger i første runde. Satt i styret frem til 2018. Her er forøvrig et bra intervju med Sam Altman, selskapets CIO (betalingsmur)). Så hva er greia med Microsoft og aksjekjøp?

Microsoft gikk inn med $1 milliard i 2019, $2 milliarder i 2021 og nye $10 milliarder nå i en verdsettelse på $29 milliarder. Avtalen sier videre at Microsoft skal få 75% av utbyttet inntil de har fått tilbake pengene sine. Deretter vil MS ende opp med en eierandel på 49 %. Andre eiere vil også sitte med 49 %, og OpenAIs non-profit sitte igjen med 2 %. 

Microsoft er forøvrig igang med å rulle ut Chat-GPT i sine tjenester. Både den og Dall-E 2 er tilgjengelige på Azure. Microsoft skulle opprinnelig relansere Bing i mars, basert på Chat-GPT 4 (og ikke 3 som er tilgjengelig i dag), men har allerede lansert en tidlig versjon.


Her er forøvrig Microsofts offisielle tidslinje for sitt AI-arbeid. Og som den observante leser vil se, så er det stort sett OpenAI som står bak det meste:


OpenAI har forøvrig fått kritikk for å bruke Kenyanske arbeidere som fikk betalt mellom 10 og 20 kroner per time for å «sensurere» Chat-GPT. Med andre ord, sørge for å filtrere bort de svarene som gjør seg minst på trykk. Arbeidsmiljøet var vel heller ikke all verden å skryte av. PTSD faktisk? Det må virkelig ha vært noe å ta tak i. Det er forøvrig mulig å «jail-breake» Chat-GPT for å komme seg rundt disse sperrene. Evt. spørre på en litt annen måte om du vil.

Image

OpenAI har forøvrig også leid inn mer enn 1000 personer i Sør-Amerika og Øst-Europa hvorav 600 skal jobbe med klassifisering av materiale som kan brukes blant annet for selvkjørende biler, mens 400 er utviklere som skal skrive kode som kan brukes til å trene deres produkt for utvikling av utviklerkode.

Uansett, de kan iallefall trøste seg med å være det produktet som raskest nådde 100 millioner brukere. Tok to måneder. TikTok hadde den forrige rekorden på 9 måneder, mens Instagram hadde den før det igjen med 2 1/2 år.

Det har forøvrig allerede begynt å poppe opp et helt øko-system av gode implementasjoner. Ta for eksempel en titt her (kode), her eller her for noen tilsvarende tjenester som fokuserer på reise. Slik finnes det implementasjoner innen de aller fleste temaer og jeg måtte dessverre begrense meg til et tilfeldig ett. Ellers ville dette nyhetsbrevet blitt fryktelig langt.
Mer enn 520 algoritmer er godkjent for medisinsk arbeid av FDA

Legemiddelindustrien og helsesektoren er blant de som har virkelig hatt mye positiv effekt av maskinlæring. Det gjøres for eksempel knapt fremskritt innenfor kreftforskningen som ikke i stor grad er basert på maskinlæring. Siste opptelling nå er at FDA har godkjent 520 algoritmer. En av disse kan hjelpe deg å slutte å røyke
It’s all fun and games – Litt diverse tidsfordriv

For deg som ikke kan få nok av Seinfeld, så genereres det nå en uendelig strøm av Seinfeld-innhold her. Eller rettere sagt, det ble generert nytt innhold 24/7 siden 14. desember, inntil karakteren Jerry gikk litt utenfor hva som regnes som politisk korrekt. Showet er nå stoppet i 14 dager.  

Maskinlæring har dekryptert et 400 år gammelt brev fra «Mary, Skottenes dronning», som har vært en utfordring for historikere siden hun ble halshugd i 1587. 

Chat-GPT har mange gode siden, men har nå hatt sine utfordringer og det har vært rapportert en del spinnville svar. Her er de største tabbene samlet.

Her er et lite quiz-spørsmål: Når ble neurale nett oppfunnet, eller sagt på en annen måte, hvor langt tilbake må vi for å finne de første stegene som ble til neurale nett? Svarte du 1943, så får du full pott. Ellers bør du kanskje lese «A Brief History of Neural Nets». Om du heller vil lese bakgrunnshistorien for de nye språkmodellene, så finner du den her eventuelt en leseliste her. Blir det for lite ambisiøst, og du vil lære hele historien om AI? Ja, da må du nok belage deg på noen års studier. Om du imidlertid kun har 10 minutter, så kan du gå hit.

Lyst til å bli en suksessrik barnebokforfatter med null innsats? Automatiser historieskrivingen med et AI-verktøy (ja, du kan sikkert gjette hvilke som kan bistå deg) og les her hvordan det kan autogenereres bilder som settes sammen til en bildebok. Muligens jeg er litt gammeldags som tror barn fremdeles leser bøker. Så kanskje heller få autogenerte filmer? Kan det bli enklere?

Har du forøvrig fått deg en wifi-tilkoblet brødrister? Hvis ikke, så kan livet ditt umulig være komplett. Eller? Mindre enn 50 % av alle smart-enheter er faktisk koblet til nettet. Så kanskje det ikke er helt kritisk alikevel?
Litt tekniske nyheter helt til slutt…

TensorFlow var lenge det ledende verktøyet for bygging av neurale nett. PyTorch tok vel over stafettpinnen rundt 2019 eller noe der omkring. Siden forrige nyhetsbrev har PyTorch hatt sin årlige konferanse med flere nyheter. Da ble PyTorch 2.0 annonsert. API vil ikke endres men det kommer mange effektivitetsforbedringer. En del av kodebasen vil bli endret fra C++ til Python for å gjøre det enda mer brukervennlig. Grafer kan kompileres med torch.compile. PyTorch kan forøvrig fremdeles brukes i eager mode. Lovely tensors er et nytt bibliotek som vil gjøre debugging lettere. Jupyter Notebooks får også endelig multi-GPU støtte. Og har du ikke helt fått dreisen på Pandas enda? Da kan du gå hitBert er forøvrig et svært sentralt verktøy innen NLP. Visste du at man kan bruke Bert med Convolutional Networks også? Og om heller tidsserier er din greie, så ta en titt her.

Her er forøvrig Chat-GPTs svar til alle spørsmål på StackOverflow. Også de uten andre besvarelser. Og ønsker du å tune den til ditt innhold, da kan du starte her og fortsette her. Skal du forøvrig bruke Chat-GPT i egen kode, så kan det være en ide med en tracker så ikke eventuelt kostnader skal gå helt amok. Om OpenAI går amok når noen har funnet et smutthull til å kunne implementere ChatGPT gjennom Docker på egen maskin, skal jeg ikke spekulere i. Men om du har Docker installert, kan du laste ned containeren og prøve her. Og når du først er igang, så kan du nå få NLP i SQL eller rett og slett erstatte en SQL-analytiker med 26 Chat-GPT kommandoer. 

Og der tror jeg vi setter strek for denne gangen. Det ble veldig mye Chat GPT denne gangen. Litt for mye vil kanskje noen si. Men interessen for dette temaet har eksplodert de siste ukene, og som en lettpåvirkelig sjel lar jeg meg selvsagt rive med. Men det er det slutt på fra og med neste nyhetsbrev. Da skal alt bli så mye bedre. Blir det ikke det, så lar jeg AI skrive hele brevet. For AI er jo alltid helt nøytralt. For det sier iallefall AIen selv. Og som jeg har lært fra barnsben, står det i avisen, eller internett som det idag heter, så er det jo alltid sant.


Med vennlig hilsen,
Øyvind Dale Spørck

oeyvind@sannsyn.com
Mobil: 92 444 777
Sannsyn AS
Har du fått tilsendt dette nyhetsbrevet, og gjerne vil ha det direkte? Da er det bare å hoppe over hit, så slipper du å gå glipp av noe som helst
Har du forøvrig ikke sett videoen vår enda, så gjør det nå. Under 2 min, og faktisk ganske morsom om jeg skal si det selv. 

Kaboom! Og da var det launch

*|MC:SUBJECT|*

Kaboom!

Hei, 

og velkommen til Sannsyns helt rykende ferske nyhetsbrev.  

For noen år siden sto følgende sitat på trykk hos Harvard Business Review:

«Data Science – The Sexiest job in the 21st century»

Som en av Norges ledende miljøer innen data science, kan vi vel ubeskjedent si at om vi skal følge dette resonnementet, så består nok Sannsyn nok av Norges absolutt mest sexy mennesker. Og om du tror på det, så har jeg en helt fantastisk bruktbil jeg kunne tenke meg å selge deg: «Special price for you my friend».

Det du imidlertid kan tro på, er at Sannsyns helt nye nyhetsbrev kommer til å endre din oppfattelse av nyhetsbrev, kunstig intelligens og ja kanskje livet som helhet. 

Ok, den siste der kan vi kanskje moderere noe, men vi har iallefall ambisjoner. Vi skal gi deg oversikten over hva som skjer innenfor maskinlæring, kunstig intelligens og kanskje enda viktigere gi deg noen veldig gode innspill om hvordan du kan utnytte at denne verdenen går fremover i din egen virksomhet. 

Så vi skal holde selvskrytet til et minimum. Faktisk skal vi kutte det helt ut. Vi skal utelukkende fokusere på hva som skjer innenfor fagfeltet og forhåpentligvis om hvordan dette kan brukes praktisk. Ønsker du derimot å høre om alle våre fantastiske prosjekter, våre fantastiske folk eller lurer på hvor mange ganger jeg kan klare å skrive fantastisk i en enkelt setning, så tar du bare kontakt. Så skal du gjerne få vite mer. 

Problemet er selvsagt at leserne av dette nyhetsbrevet nødvendigvis vil drive i forskjellige bransjer. Så vi kan ikke beskrive alt for alle. Men, med litt godvilje kan det vel være at du ser hvordan dette faktisk kan tilpasses din bransje?
 

Har du kommet deg helt hit, så kan jeg fortelle deg at det er egentlig her nyhetsbrevet starter. Så ikke stopp nå, når du har kommet så godt igang
I retail må AI være overalt

Vi starter med et par linker til noen interessante artikler om hvordan AI har gått fra å være et verktøy for automatisering til å faktisk bli en tilrettelegger av bedre handel. Først en artikkel om hvordan Walmart har skapt seg en konkurransefortrinn. Walmart har forøvrig gått fra 700 000 til mer enn 60 millioner unike produkter på 10 år. Dette ville ikke vært mulig uten AI. Vi har også en artikkel som fokuserer på hvordan Wayfair (en retailer) og Spotify bruker AI til å engasjere sine kunder.
79 % treffsikkerhet på algoritmehandel

Langt mer enn 90 % av handler innen visse finansielle instrumenter handles i dag av datamaskiner. At det er lønnsomt kan vi jo se både fra resultatene de store selskapene innen bransjen genererer og fra Sannsyns eget arbeid innenfor feltet. For eksempel Virtu Financial, som er en av de store aktørene i bransjen, skrev i sin IPO presentasjon i 2014 at de hadde kun hatt en dag med tap i løpet av de siste 1238 dagene. Nå har det blitt publisert en ny forskningsrapport som kan gi ytterligere litt informasjon. Relativt enkle algoritmer kan gi en treffsikkerhet på 64 %, mens om man også har tilgang til ordreflyt, vil denne prosenten øke til 79 %. Gang dette opp med et stort antall milliarder handler og man begynner å få et pent tall.
Verdens største språkmodell for en rekke språk

En veldig stor andel av maskinlæringsutviklingen skjer i USA (og Kina), som resulterer i at det meste er fokusert på engelsk språk. Nå har imidlertid en gruppe forskere publisert en ny LLM (Large Language Models) som håndterer 46 språk. Her kan du lese mer om teknologien bak, og du kan også teste modellen her

LLM er en gren under Natural Language Processing (NLP) som igjen er en gren innen maskinlæring. NLP fokuserer på å bygge modeller som forstår og responderer på språk, om det så er skriftlig eller muntlig, og som kan respondere til dette med tekst eller tale. NLP har utviklet seg veldig fort det siste tiåret mens nå de siste par årene har mye av fokus og fasinasjon vært rundt det som kalles LLM eller Large Language Models. Du har kanskje hørt om OpenAIs GPT-3, som har flyttet hva som er mulig en del steg fremover. GPT-3 er imidlertid en relativt stor modell med rundt 175 milliarder parametere (Bloom har selvfølgelig 176 milliarder) og rundt 500 milliarder tokens som totalt trenger 800 gB lagringsplass. Estimater av hva det har kostet å trene GPT-3 med dagens skyressurser ligger i intervallet $4.6$12 millioner. Derav Large i LLM.
Tøffere tider for grafiske designere?

Dall-E skapte bølger når den kom for halvannet år siden, og har nylig kommet i en ny versjon Dall-E 2. Man kunne beskrive hva man ønsket i et bilde, og modellen ga deg et forslag. Google har nå lansert sin versjon, Imagen, som gir enda mer imponerende resultater. For eksempel, gi modellen følgende beskjed: «A bald eagle made of chocolate powder, mango and whipped cream» og en kanskje litt mer humoristisk vri «Rage against the washing machine»:
Forløpig bruk begrenser seg stort sett til søte bilder av corgier på skateboards og teddybjørner som deltar i olympiske svømmekonkurranser. Men det er naturlig å tenke seg at denne teknologien snart kan gi grafiske designere, iallefall den enklere delen av bransjen, konkurranse. For ta en titt på disse bildene, som kommer fra henholdsvis “a shiba inu dog dressed as a firefighter» eller “Frog wearing a hat, digital art”.
Man skal studere bildet ganske nøye for å se at det ikke faktisk er ekte, og det skal jo ikke så mye fantasi til for å forstå hva slik teknologi kan gjøre både innen film og design. 

Navnet Dall-E kommer forøvrig fra en kombinasjon av Salvador Dali og Pixars WALL-E, og ønsker du å leke deg litt med disse verktøyene, så har du mange muligheter. Som her, her og her.
Har pendelen begynt å svinge bort fra cloud?

«Alt skal opp i skyen» har vært mantraet en stund nå, men nå ser det ut til at en del av de større aktørene har begynt å tenke litt anderledes både på grunn av kostnader og hastigheter. Modeller begynner å bli såpass store at det ofte påløper veldig store kostnader å kjøre alt i skyen. Et annet argument som har begynt å få feste spesielt i retail er at det er bedre å kjøre mindre modeller ute på hver lokasjon, da de forskjellige lokale markedene ofte er såpass forskjellige at de trenger egne modeller, og for å unngå å måtte flytte store datamengder. Dette har også endret måten skyleverandørene tenker, som gir bedre muligheter for hybridløsninger.
Den første medisinen som er helt utviklet av AI klar for klinisk studie

Pharma.ai har fått godkjent en medisin, hvor både oppdagelse og design er gjort av AI, til kliniske tester. De første frivillige har allerede mottatt første dose
Bare å nevne AI gir fremdeles positive effekter

Accenture har undersøkt de 2000 største selskapene (per market cap) og funnet ut at de selskapene som nevner AI i kvartalspresentasjonene har 40 % større sjanse for at aksjekursen stiger enn de som ikke gjør det. 12 % av selskapene har oppnådd det Accenture definerer som «AI Achievers». Disse kan tilskrive i snitt 30 % av deres omsetning til AI og allerede før Covid, hadde 50 % større omsetningsvekst enn tilsvarende selskaper uten dette fokuset
Automatisk verifisering av Wikipedia

Som vi alle vet, Wikipedia er et av de mest suksessfulle internettprosjektene som gir oss tilgang til mer enn 6.5 millioner artikler. Fordelen og problemet med Wikipedia er at alle kan gjøre endringer, som har resultert i mange veldig bra artikler men også en del artikler som dessverre langt fra holder mål. 

Meta (jepp, gamle Facebook) har nå satt igang et prosjekt hvor maskinlæring leser igjennom mer enn 100 000 kildehenvisninger i paralell for å sjekke om disse virkelig underbygger påstandene i artiklene. Som kunnskapsbase for modellen har de bygd et datasett med mer enn 134 millioner websider. 

Dette er ambisiøst og nok noe større enn del fleste trenger. Men maskinlæring kan fint brukes til å sjekke innholdet på intranettet, i dokumentasjoner liggende eller sørge for at alt innholdet i nettbutikken er oppdatert.
AI-modeller trenes dobbelt så raskt som i fjor

Vi har alle hørt om Moores lov som sier at datamaskiner blir dobbelt så raske hvert annet år. (Egentlig sier den at antallet transistorer i en integrert krets dobles hvert annet år, men det er ikke så farlig). Utviklingen innen AI har i mange år gått raskere. Det finnes en egen benchmark for maskinlæring som heter MLPerf

Avhengig av hvilke modeller vi ser på, så har utviklingen de siste 2 årene vært 9-10 ganger. Hvilke andre felt kan vise til tilsvarende utvikling?
Tren til jobbintervjuer med AI

Google har lansert en ny tjeneste som lar deg trene på jobbintervjuer mot en AI. Fungerer vel kun på engelsk, iallfall enda, men kan jo uansett være interessant å ta en titt på. Den viser jo også litt hvor langt teknologien har kommet
En liten beklagelse er på plass. Uttrykket AI brukes mye i dette nyhetsbrevet, selv om det egentlig ikke stemmer. Det aller meste av det vi egentlig snakker om er maskinlæring. AI er mest et uttrykk konsulenter med forkjærlighet for PowerPoint og kunnskapsløse journalister bruker. Men det har nå festet seg, og vi har kapitulert, da vi forsøker å holde nyhetsbrevet relativt lite teknisk
Robot som lærer av deg

Roboter skal etter sigende kunne ta over mer og mer av våre oppgaver. Robotstøvsuger og gressklipper er jo normen i dag, og de vil stadig kunne overta flere oppgaver. Men en flaskehals er opplæring. Før du skal kunne ha for eksempel en «hushjelps-robot» hjemme, så må den tilpasses dine oppgaver og ditt miljø. Men hva om den kun kunne se deg gjøre jobben, for så å imitere deg? Her er litt interessant forskning, både med videoer, forskningsrapport og kode (kommer snart)
Er du lojal til partiet?

Det kommer jo stadig også meldinger om dystopisk bruk av AI. Kina leder vel ofte ann, og nå har de lansert en ny programvare for sjekk av partilojalitet. Programvaren bruker bildeanalyse av ansiktsuttrykk, bildescanning, EEG-analyse og analyse av brukerens hud for å avdekke lojalitet til partiet. På World Economic Forums websider er det ett innlegg om en løsning som potensielt kan bevege seg i samme retning med en løsning som kan sensurere deg på tvers av alle plattformer. Intensjonen er muligens god, men jeg kan se for meg relativt mange argumenter for at slike løsninger definitivt ikke er veien å gå.
Vil du leke deg litt med noen AI-modeller, så ta gjerne en titt på disse sidene:
 
Ett nytt AI-generert bilde hver gang du går inn på siden. Ser ekte ut, men er ikke det. 
Lar deg tegne på skjermen. Etter hver strek tar AI over og forsøker å fullføre
Gjør tegningen din til et bilde
For deg som vil spille piano, men som egentlig ikke kan det. 
Si noe, og AI leter gjennom 100 000 bøker for å finne sitater som passer
Da nærmer vi oss slutten. Men før vi er ferdig, så skal vi gi deg en siste godbit. Vår nye Sannsyn-video. Vi lover at den ikke inneholder pinlig allsang med våre ansatte eller grønnvasking på høyt nivå. 

Faktisk kan man argumentere for at den er ganske fornærmende. Vi blir jo sammenlignet med innsektsmiddel og et monster.

Men det er jo for et godt formål. Vi er på jakt etter nye folk.


Har du fått tilsendt dette nyhetsbrevet, og gjerne vil ha det direkte? Da er det bare å hoppe over hit, så slipper du å gå glipp av noe som helst