Gjør suksess med maskinlæring og data science

Inntil 73 prosent av all tilgjengelig data blir aldri brukt på en god strategisk måte, ifølge Forrester Research*. Slik bør det ikke være, mener Morten Krogh-Moe, daglig leder i Sannsyn. 

– Vi hjelper bedrifter å jobbe mer datadrevet og på den måten skape store konkurransefortrinn. Det kan for eksempel være i form av økt kundeinnsikt, mer presis markedsføring eller automatisering. 

Sannsyn er et av Norges ledende data science-byråer. På kundelisten finner vi telecom-selskapet Ice, butikkjeder som ARK Bokhandel, Sprell og elektrogrossisten Berggård Amundsen og finansselskaper som Aptic og Gabler. Selskapet står også bak personaliseringsmotoren Gravity og søkemotoren TellusR.

Lang erfaring med maskinlæring

Mens mange byråer sliter med å tiltrekke seg jobbsøkere med nødvendig kvalifikasjoner innen maskinlæring og data science, er tilgangen på kvalifisert arbeidskraft foreløpig ikke er noe problem for Sannsyn.

– Selskapet ble etablert allerede i 2012, noe som gjør oss til et av Norges mest erfarne fagmiljøer innen dette domenet. Lang fartstid i kombinasjon med dyktige ansatte og mange attraktive prosjekter, er nok mye av grunnen til at folk søker seg til oss. Hos oss får man jobbe med det nyeste innen teknologi, ikke bare snakke om den, sier Krogh-Moe og gir dermed et lite stikk til en del av de nye aktørene som har kommet inn på markedet de siste årene.

I dag har hver fjerde ansatte i Sannsyn en PH. D, nær 90 prosent har en mastergrad, mens hver tredje har publiserte forskningsresultater. 

Levende fagmiljø

I høst ansatte Sannsyn Øyvind Spørck som leder for Sannsyns nye konsulent-avdeling. Han kommer fra PA Consulting, der han har vært ansvarlig for kunstig intelligens og analyse og jobbet med kunder som Tine, Bertel O.Steen og Vy. Han har en Mastergrad innen Data Science fra Harvard University og på privaten har han også utviklet sin egen AI-baserte algoritmehandelsplattform for valuta og råvarehandel. 

Nylig ble Mohammad Hossein Golestan som i våres fullførte en doktorgrad på NTNU, også en del av Sannsyn-teamet.

– Vi ser en snøballeffekt nå. Dyktige medarbeidere tiltrekker seg kunder og spennende prosjekter. Det igjen tiltrekker seg flere dyktige ansatte. Vi har blitt en attraktiv arbeidsplass, smiler Krogh-Moe.  

Etterspørselen etter data scientists vokser fort, sier Krogh-Moe som lokker med en spennende jobb for de som måtte ende opp i Sannsyn.

– Vi kan tilby et levende fagmiljø innen data science og maskinlæring. Risikoen hvis du som data scientist går til et ordinært IT-selskap, er at du ender opp som programmerer i et stort IT-prosjekt som varer i flere år. Det er ikke slik man blir god innen data science og maskinlæring. Hos oss kan du utvikle deg som spesialist, der du sammen med dyktige kolleger får jobbe på markedets mest utfordrende prosjekter.

*Up to 73 Percent of Company Data Goes Unused for Analytics. Here’s How to Put It to Work.

– Solr er en fantastisk søkemotor og potensialet er enda større

Mange av landets nettbutikker, nettaviser og universiteter benytter Solr som søkemotor. Solr-ekspert Petter Egesund mener mange av nettsidene har et stort forbedringspotensial.

Da utvikleren Yonik Seeley jobbet med et internprosjekt i medieselskapet CNET Networks på midten av 2000-tallet, ante han lite om hvor viktig resultatet av hans arbeid ville bli.

For å gjøre en lang historie kort: Målet til unge Yonik Seeley var å lage en god søkemotor til CNET sine egne nettsider. Tidlig i 2006 gikk CNET live med søket og donerte samtidig kildekoden til Apache Software Foundation. I dag er Solr er en av to store open soure-databaser for å søke i tekst (den andre er Elastic Search).

Solr brukes i dag av mange av verdens største selskaper, inkludert Disney, Netflix, eBay og BestBuy. Også svært mange norske virksomheter har tatt i bruk Solr, inkludert Finn.no, Universitet i Oslo, ARK Bokhandel og Sprell.

Ingen over, ingen ved siden

Etter hvert har det også kommet mange kommersielle aktører på banen som tilbyr kurs, konsulenthjelp, skreddersøm, videreutvikling og support relatert til Solr.

Det norske selskapet Sannsyn AS er et slikt selskap. Petter Egesund, teknologidirektør og medgründer i Sannsyn, har jobbet med tekstsøk i nærmere tyve år.

– De fleste databaser støtter tekst på en eller annen måte, men Solr gir svært bra resultater, mye takket være stadig mer funksjonalitet og et lojalt community med et stort antall brukere, bidragsytere og programmerere.

Noe av det som gjør Solr populært er at søkemotoren er svært konfigurerbar og har gode verktøy for å vekte og justere søk i større datamengder.

Stadig testing og tuning

Sannsyn har bistått en rekke universiteter, nettaviser og nettbutikker med tekstanalyser og Solr-søk.

– Å sette opp Solr er ingen kunst og er ofte noe man kan gjøre uten ekstern bistand. Utfordringen er å ta i bruk alle mulighetene som ligger i teknologien. Det krever ofte mer Solr-kompetanse enn det man har internt i en bedrift.

For bedrifter som ønsker å forbedre sitt søk, anbefaler Egesund at man ikke iverksetter ett omfattende søkeprosjekt, men heller jobber i flere faser med stadig testing og tuning.

– Et typisk Solr-prosjekt kan grovt sett deles inn i tre deler. I første fase jobber vi med vektinger, tuning og språklige støttefunksjoner i søket. Deretter jobber vi med semantisk analyse og vekting av salg/popularitet i auto-complete og søkeresultat. I tredje og siste fase forsøker vi å personalisere søket mest mulig til hver enkelt bruker.

Store søkeforbedringer kan gjøres på noen uker, men det hele avhenger av nåsituasjon og ambisjonsnivå.

– Å jobbe med søk er både utfordrende og morsomt. Et nettsidesøk kan alltid bli litt bedre, smiler Egesund.

Lanserer egenutviklet plugin til Solr

Sannsyn leverer ikke bare Solr-rådgiving, i disse dager er Sannsyn også i ferd med å lansere en egen plugin til Solr.

– Solr er rett og slett en fantastisk søkemotor, men ingen er perfekt. Den største svakheten til Solr er at man som nettside-eier ikke får vite om søket fungerer eller ikke. Den mangler et statistisk apparat som gir innsikt i trender, nulltreff, svartid, antall feil, lengde på treffliste og så videre, sier Egesund.

– Videre mangler Solr funksjonalitet for semantiske søk og algoritmene den er basert på, forstår ikke intensjonen bak et søk.

Løsningen som kalles for TellusR og beta-testes i disse dager hos flere av Sannsyns kunder før den etter hvert skal lanseres internasjonalt.