BIG DATA – BIG BUZZ I RETAIL
22. juni 2018
Hvad er big data? Og hvordan kan data og big data blive relevant for de små og mellemstore detailbutikker (SMV). Med fokus på detailhandelen, graver vi dybere i fakta – og skræller myter, tomme buzzwords og hype væk.
Der tales rigtig meget om big data i detailhandlen. Vi behøver ikke fortælle, at mange mennesker mener, at big data bliver en meget vigtig del af fremtiden – godt understøttet af de mange eksempler. F.eks. skete det for nyligt at en kvinde, alene på baggrund af sin ændrede brugeradfærd på sine digitale platforme, fik foreslået babyprodukter, endnu før hun selv vidste hun var gravid,. Men hvad kan en dansk SMV detailvirksomhed så bruge dette forunderlige big data eventyr til? Hvis man søger efter information om big data, får man mangeartede svar. Nogle mere informative end andre. Begrebet “Big data” anvendes ofte meget bredt, eksempelvis når der tales om “Business Intelligence”, der i forvejen er et veldefineret begreb med præcise termer og rammer.
Så det kan være noget af en datajungle derude! Denne artikel er på ingen måde komplet dækkende for de mange emner inden for dette felt og repræsenterer heller ikke endegyldige sandheder. Feltet er for nyt og umodent til, at der findes helt klare definitioner og begreber. Vi må derfor lære at bruge vores fornuft og se igennem buzzwords og hype.
Hvad er big data?
Data er information. Så big data er store mængder information. Begrebet opstod i 90’erne og dækkede dengang kun over de udfordringer der kan være omkring, at skulle have større servere, harddiske og programmer end normalt. For pludselig stod man over for større mængder information, som skulle flyttes, lagres og fortolkes. Dermed måtte elektronikproducenter og softwareudviklere tænke i nye baner, så deres løsninger kunne håndtere disse enorme mængder data.
Big data forstås efterhånden bredere end blot, at bygge systemer, der kan håndtere de store mængder data. McKinsey karakteriserer ”hovedkomponenter og økosystemet omkring big data” således:
- Teknikker for at analysere data, f.eks. A/B tests, maskinlæring og talegenkendelse.
- Big data-teknologier som f.eks. business intelligence (BI), cloud tjenester og databaser.
- Visualiseringer, f.eks. diagrammer og grafer.
Bemærk ordene økosystem og hovedkomponenter. Dermed forstås, at ovenstående elementer hænger sammen. Med andre ord, hvis nogen tilbyder, at sælge din organisation en big data løsning, som kun består af lækre visualiseringer af data, så er der noget galt. For hvilke data skal visualiseres? Hvordan bliver data indsamlet og behandlet?
På samme måde, hvis man tilbydes et nyt smart kunstig-intelligens-baseret program, som kan identificere købsmønstre hos din kunder, ja, så er det rigtig vigtigt, at der også følger noget dataindsamling om dine kunder med – ellers er den kunstige intelligens værdiløs. For så er det igen kun en del af økosystemet, der tilbydes.
Alligevel ser man ofte begreberne præsenteret alene, uden deres økosystem. Når man præsenterer en BI (Business Intelligence) løsning i isolation, så er der altså ikke nødvendigvis tale om big data. Måske bare nogen, som følte det var et bedre buzzword, at klistre på deres produkt, eller (forhåbentlig) nogle mennesker, som har valgt, at udvikle et specialiseret produkt, som fokuserer på en del af dataøkosystemet.
Kan en SMV håndtere et helt økosystem omkring big data?
Før vi kan besvare dette meningsfuldt, må vi først kigge nærmere på elementerne i økosystemet, og deres definitioner, dvs. vi kigger nærmere på de begreber, som nævntes i definitionen ovenfor:
- Cloud tjenester og databaser: Dette betyder at virksomhedens data ikke er placeret in-house på en server, men i stedet er placeret uden for huset. Man har outsourcet håndteringen af adgang, tilgængelighed og opbevaring af virksomhedens data.
- Dataanalyse: A/B test: At køre kontrollerede forsøg på f.eks. produkter eller services, hvor kun 1 faktor adskiller sig. Dermed kan man dele sit marked i en A og en B gruppe. f.eks. kunne Wupti.com (webbutik) lave et forsøg hvor de kører med internetreklamer der blinker på Lolland (A), og mere diskrete reklamer på Falster (B). De to markeder minder om hinanden, og det er nemt at måle forskellene. Efter 3 måneder kan man så måle hvilket marked, der klarede sig bedst.
- Dataanalyse: Maskinlæring og kunstig intelligens: At få et computerprogram til at finde mønstre i ustruktureret data. Dette gør programmet i stand til at lede efter mønstre i gammel og ny data. Dette kan bruges i et hav af sammenhænge, som f.eks. tekst-til-tale, tale-til-tekst, men også mere jordnært i detailhandlen: Forudsige kundemønstre, anbefale nærliggende varer, osv.
- Visualiseringer: Visualiseringer handler om mulighederne for at præsentere diagrammer, grafer og data. Men hvis der ikke er noget data, er der ikke noget at visualisere. Hvis der på den anden side er data, men det ikke kan visualiseres eller på anden måde eksponeres, så der kan tages beslutninger, så er dataen ubrugelig.
Et komplet big data eksempel med alle hovedkomponenter:
Ovenstående stumper af økosystemet er en typisk pakke. F.eks. kan dine data placeres i skyen hos en af verdens største clouddatabaser, Amazon Web Services (AWS). Så kunne I lave en A/B test i jeres webshop, hvor I lader hver anden kunde få anbefalet lignende varer på total tilfældig basis, og lade resten af kunderne få anbefalet varer, baseret på hvad andre kunder, som kiggede på denne vare, købte. Men hvordan ved I så hvad andre kunder købte? Det kræver, at I indsamler data om alle kunder, lagrer det hos jeres cloud udbyder, og så lader en maskinlæringsløsning analysere dataen for at finde sammenhængene (mønstre). Når A/B testen er slut, vil I så igen have samlet en masse data. Steg indtjeningen på de kunder som fik intelligente anbefalinger? Dette skal I så sørge for at få viderekommunikeret til relevante stakeholders. Hvis I skal have en chance for at få overblik over tendenser hos kunderne i de foregående trin, så får I brug for at få visualiseret den indsamlede data. Du kan ikke selv fortolke på rå data. En visualisering behøver ikke være flot og farverig – en visualisering kan være et enkelt tal, resultatet af et regnestykke. F.eks hvor meget indtjeningen steg i den ene kundegruppe i A/B testen. I din endelige præsentation af resulater for stakeholders, kan det være rart at vise de mange mellemregninger og resulater i grafer og diagrammer, som måske endda automatisk tegnes ud fra live-kundedata, på et dashboard.
Således kan vi se hvordan den ene aktivitet fører direkte til den næste, og at ingen af aktiviteterne kan køre uafhængigt af hinanden. Så big data giver altså kun mening, hvis man betragter det som en del af hele forretningen. Både den nuværende og den fremtidig ønskede situation for forretningen.
Og nu er vi så lidt nærmere på at kunne besvare spørgsmålet: Kan en SMV finde ressourcerne til at håndtere et økosystem omkring big data? Umiddelbart virker det som ekstremt ressourcekrævende at få styr på dataopbevaring, dataanalyse og datavisualisering for en mindre virksomhed.
Især kan det virke skræmmende med alle disse begreber, som kan lyde ressourcekrævende. Så lad os lige prøve at skære definitionerne endnu mere ind til benet:
Indsamling af data: Hvordan får du dine data? Alt det data, som skal gemmes, skal komme et sted fra
Lagring: Data skal gemmes et sted – i skyen eller in-house på en server
Visualisering: Data skal kunne bruges af dine kunder eller ledelse til at tage beslutninger eller forbedre oplevelser
Fortolkning: Vi har brug for software til fortolkning af store mængder data. Her kommer maskinlæring ind i billedet.
Nu vi har kogt McKinseys definition ned til noget mere håndgribeligt, kan vi måske gribe big data an på et mere jordnært plan
Og her er det så vigtigt at pointere, at ovenstående eksempel med alle hovedkomponenterne er et skoleeksempel på et big data setup, men der er masser af andre big data setups.
F.eks. kan din virksomhed indsamle egen data, via et nyhedsbrev. Der findes lettilgængelige produkter, der kan hjælpe dig med at få gang i et nyhedsbrev. På websiden hvorfra man udsender nyhedsbrevet, vil du kunne se data om hvem der klikkede på hvad i dit nyhedsbrev, hvor mange, der overhovedet åbnede det, osv. Dermed kan du måle, om det er værdifuldt, at fortsætte med at bruge tid og penge på nyhedsbrevet. Er det big data? Ud fra nogle definitioner, ja. Andre vil på ”godt gammeldags dansk” bare kalde det for user analytics. Uanset begreb er nyhedsbreve en automatiseret tilgang til dele af dataindsamlingen og lagringen, om end fortolkningen er manuel.
Isbutikken
Men indsamling og lagring behøver ikke være noget som en mindre butik foretager selv. Der findes mange tilgængelige tjenester man kan benytte sig af. Fx tilbyder Open Weather Maps (openweathermaps.org) gratis data om vejret i mere end 200.000 byer. Det er eksempel på en af de mange organisationer som indsamler og lagrer data, og gør det tilgængeligt for andre at bruge.
Et eksempel på en virksomhed, der kan bruge data og big data, uden at skulle forholde sig til hele økosystemet, kunne fx være en isbod ved stranden. Denne isbod, som er en lille virksomhed og ikke en del af en større kæde, kan ikke mønstre ressourcerne til selv at rumme hele big data økosystemet. Men en nem måde at komme i gang på, kunne fx være at bruge data fra Open Weather Maps. Isboden skal blot forholde sig til de sidste dele af dataøkosystemet, og ikke indsamling af verjdata. Fortolkning og visualiseringen kunne munde ud i ændrede varebestillinger, butiksindretning eller andet.
Fx kunne der automatisk bestilles ekstra mange is hvis der blev lovet godt vejr i morgen, da det må forventes ekstra mange strandgæster, og måske priserne stiger automatisk. Måske markisen automatisk kører ind før stormvarsel.
Her bliver isboden en del af big data økosystemet uden at skulle investere massivt i dataindsamling osv. Ordet ”automatisk” er vigtigt her – for hvis man selv tjekker tv-avisen dagen før, og man så ruller en ekstra isfryser ud i stedet for boden med de belgiske vafler, så er der ikke tale om big data. Så er der blot tale om almindelig rettidig omhu. Der er således kun tale om big data (eller data i dette tilfælde), hvis en eller flere af big data komponenterne automatiseres (dataindsamling, fortolkning eller visualisering).
Andre eksempler kan være modsatte – at man selv indsamler data om sine kunder ved relevante touchpoints, men outsourcer fortolkning, analyse og visualisering til tredjepart. Denne model kan i praksis være uhensigtsmæssig, da virksomheden, derimod ved at være med fra start til slut, selv støtter og sikrer værdiskabelsen i de samlede dataprocesser, og dermed både vil få bedre overblik i processen og skabe bedre resultater i sidste ende – præcis som det ofte foregår under virksomhedens øvrige forandringsprocesser.
Vi håber ovenstående eksempler kan bringe big data lidt ned på jorden, så selv små og mellemstore virksomheder tør at kaste sig ud i det.
Er din organisation klar til at bruge big data?
Men inden du kaster sig ud i at investere i nogle eller alle big data-hovedkomponenterne, skal dufå afklaret hvad formålet med indsatsen er. Hvad vil du have ud af en big data strategi? Er din organisation klar?
Heldigvis har vi et værktøj til rådighed som hedder #Dataforbusiness. Det er finansieret af Industriens Fond. Det er udviklet af Alexandra Instituttet, DTU Compute, Teknologisk Institut og CLEAN.
#Dataforbusiness er et værktøj, som mest er rettet mod større organisationer, men også SMV’er kan drage nytte af det. Man bruger 20-30 minutter på at indtaste en række oplysninger om sin virksomhed samt virksomhedens forståelse og tilgang til data og big data. Dette munder så ud i en interaktiv rapport, hvori man kan se hvordan virksomhedens forskellige medarbejdere har vurderet virksomhedens dataparathed. Derudover kan man sammenligne sin virksomhed med andre virksomheder på tværs af forskellige dimensioner. Dette er ikke et magisk værktøj, som straks giver dig overblik over hvilken big data strategi I skal have – men værktøjet kan hjælpe til at oplyse og sætte gang i debat omkring hvad data kan betyde for jeres organisation. Værktøjet finder du her, og det er gratis at bruge:
https://bdba.networkedbusiness.org/data%20for%20business
God fornøjelse i datajunglen!
Retail Reinvented er ikke forbundet med McKinsey eller #Dataforbusiness værktøjet.
Artiklens forfatter:
Jan Borg, Adjunkt, Cphbusiness
borg@cphbusiness.dk
Læs også Peters Skjold Mogensens artiklen “Big Data og detailhandel”, der handler om hvordan butikkerne anvender big data.
Andre gode links til emnet:
https://en.wikipedia.org/wiki/Big_data
http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation