Maskinlæring

Maskinlæring eller det man på engelsk kaller «machine learning» handler om å identifisere mønstre i store mengder data for deretter å ta intelligente beslutninger (automatisering), men også forutse hendelser og resultater.

Autonome kjøretøy, tale- og lydgjenkjenning, målrettet reklame og anbefalinger (f.eks produkter, filmer og musikk) og prediksjon (forutse fremtidige hendelser) er i stor grad blitt mulig på grunn av maskinlæring.

Når vi snakker om maskinlæring, snakker vi om teknikker, der reglene utledes fra de dataene systemet trenes på. Dette i motsetning til regelbaserte systemer der reglene er gitt av mennesker, gjerne basert på eksperterfaring, forretningslogikk eller regelverk.

Maskinlæring regnes ofte som et subdomene innen kunstig intelligens, men det er et er egentlig litt upresist da avansert maskinlæring også inneholder teknikker som ikke tilhører AI-feltet. På den annen side finnes det 100-150 forskjellige AI-teknikker, hvorav kun et fåtall maskinlæringsteknikker.

Maskinlæringens historie

Maskinlæring baserer seg på statistiske modeller, matematisk optimalisering og algoritmer. Det er slik sett ikke et nytt fagfelt, men fagfelt har utvilsomt blitt mer aktuelt med kraftigere teknologi, mer avanserte algoritmer og stadig mer data.

Begrepet kunstig intelligens dukket opp for første gang i 1956, mens begrepet maskinlæring ble introdusert kort tid etter. Et av de første prosjektene innen maskinlæring ble igangsatt av Frank Rosenblatt så tidlig som i 1957  (kjent som «Preceptron»).

En annen milepæl fant sted i 1965 da Alexey Ivakhnenko skisserte det første dype nevrale nettverket og beskrev hvordan man kunne løse store utfordringer ved hjelp av maskinlæring. Deretter skjedde det lite innen dette fagfeltet frem til 1975 da Paul Werbos lanserte en løsning for å endre vektingen i nevrale nettverk (kjent som «Backpropagation»), noe som igjen er relevant for trening av nevrale nettverk. Paul Werbos arbeid var for øvrig viktig for Yann LeCun sin praktiske løsning for å identifisere håndskrift ved hjelp av en datamaskin (1989).

Flere typer maskinlæring

Maskinlæringsalgoritmer bygger matematiske modeller basert på eksempeldata eller treningsdata. Disse modellene brukes deretter til å ta beslutninger.

Vi skiller i hovedsak mellom to typer maskinlæring:

  • Supervised machine learning: Ved «veiledet læring» brukes algoritmer gjerne på merkede datasett som består av både spørsmål og svar, der modellen lærer seg å predikere riktig svar, gjerne basert på store mengder data. Classification og regression er to av de mest utbredte formene for supervised learning. Classification er evnen til å kategorisere et resultat (f.eks «rød» eller «grønn» – eller «sykdom» eller «ikke sykdom»), mens regression handler om å gi et eksakt svar (f.eks et beløp eller vekt, nyttig for eksempel om du skal predikere eiendomspriser). Nyttige algoritmer her kan være for eksempel lineær regressjon og nevrale nettverk.
  • Unsupervised machine learning: Ved «ikke-veiledet læring» brukes algoritmene på «umerkede» datasett, der man kun har eksempler på inputdata og ingen tilhørende output (det finnes altså ikke noe eksakt og riktig svar). Her må modellen forsøke å finne mønster og organisere innholdet. Clustering og associationer eksempler på denne typen maskinlærings-algoritmer. Clustering kan for eksempel brukes for å gruppere kunder etter kjøpsatferd, mens association for eksempel kan brukes for å beskrive typisk atferd (f.eks «kunder som har kjøpt dette produktet, kjøper ofte også dette»). Dyplæringsalgoritmer trenes gjerne opp med denne typen maskinlæring.

Kort sagt kan man si at supervised machine learning passer godt når man har god oversikt over problemområdet, en stor mengde tilgjengelig data med riktige svar og en viss forståelse av sammenhengen mellom input-data og output-data. Unsupervised learning er derimot mest aktuelt når det ikke finnes noe riktig svar og det i stedet handler om å se sammenhenger mellom forskjellige datapunkter.

I mange tilfeller er kun deler av dataen merket, da snakker vi gjerne om semi-supervised machine learning, hvilket er en blanding av supervised machine learning og unsupervised machine learning. Et eksempel på dette er et fotoarkiv, der kun deler av bildedatabasen er merket (f.eks med «hund», «katt» eller «Menneske»).

I tillegg har vi en tredje form for maskinlæring, reinforcement learning (såkalt «forsterkende læring»). Her bygges algoritmen sin modell basert på unsupervised machine learning, men får fortløpende tilbakemelding om beslutningen den foreslår er god eller dårlig.  Dette forklares best med et enkelt eksempel: Når du lærer å sykle, handler alt om å bli værende på sykkelen og ikke falle. Hjernen lærer seg hva som gjør at man faller (feil atferd) og hva som gjør at man blir værende på sykkelen (riktig atferd). Dette har for eksempel vært nyttig i utviklingen av sjakk-spill og selvkjørende biler.

Sannsyn og maskinlæring

Sannsyn har jobbet med maskinlæring siden vi ble etablert i 2012 og regnes i dag som et av Norges ledende selskaper innen dette området. Vi har ved mange anledninger jobbet i prosjekter, der vi bruker dyp læring og dype nevrale nettverk og annen form for maskinlæring. Ta gjerne kontakt om du ønsker å vite mer om vår kompetanse på dette området!

Kontakt oss

Sannsyn AS

c/o Epicenter

Edvard Storms gate 2 0166 Oslo, Norway

+ 47 905 31 877

info@sannsyn.com

Personvernerklæring