Maskinlæring

Maskinlæring eller det man på engelsk kaller «machine learning» handler om å identifisere mønstre i store mengder data for deretter å ta intelligente beslutninger (automatisering), men også forutse hendelser og resultater.

Autonome kjøretøy, tale- og lydgjenkjenning, målrettet reklame og anbefalinger (f.eks produkter, filmer og musikk) og prediksjon (forutse fremtidige hendelser) er i stor grad blitt mulig på grunn av maskinlæring.

Maskinlæring baserer seg på statistiske modeller, matematisk optimalisering og algoritmer og er slik sett ikke et nytt fagfelt. Men maskinlæring som fagfelt har utvilsomt blitt mer aktuelt med kraftigere teknologi, mer avanserte algoritmer og stadig mer data. Maskinlæring regnes som et subdomene innen kunstig intelligens.

Maskinlæringens historie

Kunstig intelligens som begrep dukket opp i 1955, mens begrepet maskinlæring ble introdusert kort tid etter. Et av de første prosjektene innen maskinlæring ble igangsatt av Frank Rosenblatt så tidlig som i 1957  (om du er nysgjerrig på dette prosjektet, så kan du søke etter «Preceptron»). En annen milepæl fant sted i 1965 da Alexey Ivakhnenko skisserte det første dype nevrale nettverket og beskrev hvordan man kunne løse store utfordringer ved hjelp av maskinlæring. Deretter skjedde det lite innen dette fagfeltet frem til 1975 da Paul Werbos lanserte en løsning for å endre vektingen i nevrale nettverk (kjent som «Backpropagation»), noe som igjen er relevant for trening av nevrale nettverk. Paul Werbos arbeid var for øvrig viktig for Yann LeCun sin praktiske løsning for å identifisere håndskrift ved hjelp av en datamaskin (1989).

Full fart innen maskinlæring fikk vi dog først på 2000-tallet. Det var tre årsaker til at fagfeltet da fikk en kraftig oppblomstring: 1) Algoritmer 2) Digitale medier 3) Store forbedringer av datakraft

To typer maskinlæring

Vi skiller i hovedsak mellom to typer maskinlæring, nemlig supervised machine learning og unsupervised machine learning.

Supervised machine learning: Her brukes algoritmer gjerne på merkede datasett som består av både spørsmål og svar, der modellen lærer seg å predikere riktig svar, gjerne basert på store mengder data. Classification og regression er to av de mest utbredte formene for supervised learning. Classification er evnen til å kategorisere et resultat (f.eks «rød» eller «grønn» – eller «sykdom» eller «ikke sykdom»), mens regression handler om å gi et eksakt svar (f.eks et beløp eller vekt, nyttig for eksempel om du skal predikere eiendomspriser). Nyttige algoritmer her kan være for eksempel lineær regressjon og nevrale nettverk.

Unsupervised machine learning: Her brukes algoritmene på «umerkede» datasett, der man kun har eksempler på inputdata og ingen tilhørende output (det finnes altså ikke noe eksakt og riktig svar). Her må modellen forsøke å finne mønster og organisere innholdet. Clustering og associationer eksempler på denne typen maskinlærings-algoritmer. Clustering kan for eksempel brukes for å gruppere kunder etter kjøpsatferd, mens association for eksempel kan brukes for å beskrive typisk atferd (f.eks «kunder som har kjøpt dette produktet, kjøper ofte også dette»).

Kort sagt kan man si at supervised machine learning passer godt når man har god oversikt over problemområdet, en stor mengde tilgjengelig data med riktige svar og en viss forståelse av sammenhengen mellom input-data og output-data. Unsupervised learning er derimot mest aktuelt når det ikke finnes noe riktig svar og det i stedet handler om å se sammenhenger mellom forskjellige datapunkter.

Andre former for maskinlæring

I mange tilfeller er kun deler av dataen merket. Da snakket vi gjerne om semi-supervised machine learning. Et eksempel på dette er et fotoarkiv, der kun deler av bildedatabasen er merket (f.eks med «hund», «katt» eller «Menneske»).

I senere tid har vi også fått reinforcement learning. Dette forklares best med et enkelt eksempel: Når du lærer å sykle, handler alt om å bli værende på sykkelen og ikke falle. Hjernen lærer seg hva som gjør at man faller (feil atferd) og hva som gjør at man blir værende på sykkelen (riktig atferd). Dette har for eksempel vært nyttig i utviklingen av sjakk-spill og selvkjørende biler.

Sannsyn og maskinlæring

Sannsyn har jobbet med maskinlæring siden vi ble etablert i 2012 og regnes i dag som et av Norges ledende selskaper innen dette området. Vi har ved mange anledninger jobbet i prosjekter, der vi bruker dyp læring og dype nevrale nettverk og annen form for maskinlæring. Ta gjerne kontakt om du ønsker å vite mer om vår kompetanse på dette området!

Kontakt oss

Sannsyn AS

c/o Epicenter

Edvard Storms gate 2 0166 Oslo, Norway

+ 47 905 31 877

info@sannsyn.com

Personvernerklæring