Maskinlæring finnes i mange former – her er de viktigste

Maskinlæring handler om å identifisere mønstre i store mengder data.

Foto: Markus Spiske. Bildet er hentet fra Pexels.com.

Maskinlæring eller det man på engelsk kaller «machine learning» handler om å identifisere mønstre i store mengder data for deretter å ta intelligente beslutninger (automatisering), men også forutse hendelser og resultater.

Autonome kjøretøy, tale- og lydgjenkjenning, målrettet reklame og anbefalinger (f.eks produkter, filmer og musikk) og prediksjon (forutse fremtidige hendelser) er i stor grad blitt mulig på grunn av maskinlæring.

Maskinlæring regnes ofte som et subdomene innen kunstig intelligens, men det er et er egentlig litt upresist da avansert maskinlæring også inneholder teknikker som ikke tilhører AI-feltet. På den annen side finnes det 100-150 forskjellige AI-teknikker, hvorav kun et fåtall av dem er maskinlæringsteknikker.

Hva er maskinlæring?

Maskinlæring kan sees på som generiske algoritmer som kan fortelle deg noe interessant om et datasett uten at du trenger å skrive egendefinert kode som er spesifikk for problemet. I stedet for å skrive kode, kan man si at du mater data til den generiske algoritmen, og den bygger egen logikk basert på dataene. Dette i motsetning til regelbaserte systemer der reglene er gitt av mennesker, gjerne basert på eksperterfaring, forretningslogikk eller regelverk:

Et eksempel på dette er en klassifiseringsalgoritme. Den samme klassifiseringsalgoritmen som ble brukt til å gjenkjenne håndskrevne tall, kan også brukes til å klassifisere e-post som er spam og ikke spam uten å endre en kode. Det er den samme algoritmen, men den blir matet med forskjellige treningsdata og kommer dermed med en annen klassifiseringslogikk.

  • Bank: Automatisert anbefalinger av potensielle handler og investeringer, handelsstrategier, robotrådgivere, analyse av kundeatferd, chatbots for kundetjenester, identitetsbekreftelse og svindeloppdagelse.
  • Offentlig sektor: Smart overvåking, avdekke trusler, «Smart Cities» og smarte forsyninger. AI-forbedret og personlig utdanning og opplæring, chatbots for informasjonsdistribusjon og inkludering av borgere.
  • Medier: Kundeanalyse, prognoser, trendanalyse, videoanalyse og datasyn (f.eks. i videospill).
  • Retail: Kundeanalyse, prognoser, forutse etterspørselstrender, redusere inntektsløp, supply chain management, lagerautomatisering, chatbots for kundetjenester og enklere check-outs.
  • Forsikring: Administrasjon av utbetalinger og oppdagelse av svindel, analyse av kundeatferd, automatisert forsikring, prising, samtaleplattformer for kundetjenester i samsvar med regelverk og handelsstrategier.
  • Energi: Predikere etterspørsel basert på AI-drevet analyse, prediktivt vedlikehold, dynamisk prising basert på forbruksanalyse levert av smarte målere, for eksempel chatbots for kundeservice.

Maskinlæringens historie

Maskinlæring baserer seg på statistiske modeller, matematisk optimalisering og algoritmer. Det er slik sett ikke et nytt fagfelt, men fagfelt har utvilsomt blitt mer aktuelt med kraftigere teknologi, mer avanserte algoritmer og stadig mer data.

Begrepet kunstig intelligens dukket opp for første gang i 1956, mens begrepet maskinlæring ble introdusert kort tid etter. Et av de første prosjektene innen maskinlæring ble igangsatt av Frank Rosenblatt så tidlig som i 1957  (kjent som «Preceptron»).

En annen milepæl fant sted i 1965 da Alexey Ivakhnenko skisserte det første dype nevrale nettverket og beskrev hvordan man kunne løse store utfordringer ved hjelp av maskinlæring. Deretter skjedde det lite innen dette fagfeltet frem til 1975 da Paul Werbos lanserte en løsning for å endre vektingen i nevrale nettverk (kjent som «Backpropagation»), noe som igjen er relevant for trening av nevrale nettverk. Paul Werbos arbeid var for øvrig viktig for Yann LeCun sin praktiske løsning for å identifisere håndskrift ved hjelp av en datamaskin (1989).

Flere typer maskinlæring

Maskinlæringsalgoritmer bygger matematiske modeller basert på eksempeldata eller treningsdata. Disse modellene brukes deretter til å ta beslutninger.

Vi skiller i hovedsak mellom to typer maskinlæring:

  • Supervised machine learning: Ved «veiledet læring» brukes algoritmer gjerne på merkede datasett som består av både spørsmål og svar, der modellen lærer seg å predikere riktig svar, gjerne basert på store mengder data. Classification og regression er to av de mest utbredte formene for supervised learning. Classification er evnen til å kategorisere et resultat (f.eks «rød» eller «grønn» – eller «sykdom» eller «ikke sykdom»), mens regression handler om å gi et eksakt svar (f.eks et beløp eller vekt, nyttig for eksempel om du skal predikere eiendomspriser). Nyttige algoritmer her kan være for eksempel lineær regressjon og nevrale nettverk.
  • Unsupervised machine learning: Ved «ikke-veiledet læring» brukes algoritmene på «umerkede» datasett, der man kun har eksempler på inputdata og ingen tilhørende output (det finnes altså ikke noe eksakt og riktig svar). Her må modellen forsøke å finne mønster og organisere innholdet. Clustering og associationer eksempler på denne typen maskinlærings-algoritmer. Clustering kan for eksempel brukes for å gruppere kunder etter kjøpsatferd, mens association for eksempel kan brukes for å beskrive typisk atferd (f.eks «kunder som har kjøpt dette produktet, kjøper ofte også dette»). Dyplæringsalgoritmer trenes gjerne opp med denne typen maskinlæring.

Kort sagt kan man si at supervised machine learning passer godt når man har god oversikt over problemområdet, en stor mengde tilgjengelig data med riktige svar og en viss forståelse av sammenhengen mellom input-data og output-data. Unsupervised learning er derimot mest aktuelt når det ikke finnes noe riktig svar og det i stedet handler om å se sammenhenger mellom forskjellige datapunkter.

I mange tilfeller er kun deler av dataen merket, da snakker vi gjerne om semi-supervised machine learning, hvilket er en blanding av supervised machine learning og unsupervised machine learning. Et eksempel på dette er et fotoarkiv, der kun deler av bildedatabasen er merket (f.eks med «hund», «katt» eller «Menneske»).

I tillegg har vi en tredje form for maskinlæring, reinforcement learning (såkalt «forsterkende læring»). Her bygges algoritmen sin modell basert på unsupervised machine learning, men får fortløpende tilbakemelding om beslutningen den foreslår er god eller dårlig.  Dette forklares best med et enkelt eksempel: Når du lærer å sykle, handler alt om å bli værende på sykkelen og ikke falle. Hjernen lærer seg hva som gjør at man faller (feil atferd) og hva som gjør at man blir værende på sykkelen (riktig atferd). Dette har for eksempel vært nyttig i utviklingen av sjakk-spill og selvkjørende biler.