Volg ons op: , 32178 LinkedIn of

Kijk snel bij: Abonnementen Adverteren BB Magazine

Schoonheid vinden in de chaos

AfbeeldingDe Data Scientist Summit werd vorige week voor de tweede keer gehouden in Las Vegas. Vorig jaar stond de bijeenkomst in het teken van de ‘Rockstar van Big Data’: de data scientist. Dit jaar was de aandacht gericht op het data science team, want data science doe je niet alleen. Daarnaast was er veel aandacht voor de uitkomst van al die analyses uitgevoerd op enorm grote hoeveelheden data. Hoe presenteer ik mijn uitkomsten? Hoe kan ik de verkenningen die ik uitvoer op een begrijpelijke manier visualiseren? Het ontwerpen van die visualisaties is best een uitdaging. Veel van de uitkomsten gaan immers over complexe analyses maar moeten op een begrijpelijke wijze worden gepresenteerd.

Hype
Big Data heeft het afgelopen jaar flink in de belangstelling gestaan. Natuurlijk heeft het onderwerp de zweem van een ‘hype’ maar de enorme datagroei schreeuwt om nieuwe oplossingen om daar effectief mee om te kunnen blijven gaan. De techniek moet ons helpen in die enorme bergen data juist dié samenhang te kunnen vinden, die meerwaarde heeft voor de organisatie. En gelukkig komen die technieken op dit moment beschikbaar.

 

Het vinden van die verborgen informatie vraagt een nieuwe vorm van denken en werken. In feite ben je scheppend bezig om uit die ruwe data een mooie diamant te halen. Zoals Michelangelo ooit vertelde dat hij zijn beroemde Venus van Milo al in de ruwe rots verborgen zag zitten; zijn uitdaging was het overbodige graniet te verwijderen om ook anderen die schoonheid te laten zien. Een mooie metafoor voor het data scientist team: het kunnen vinden én tonen van schoonheid in de chaos van ruwe data.

 

Goed team
Maar wat maakt een data scientist team tot een goed team? Naast nieuwsgierigheid en samenwerking een goede dosis voorzichtigheid of het analysemodel wel goed is. Over disciplines heen kunnen kijken. Voorbereid zijn op het vinden van het onverwachte, de bekende serendipiteit. Tenslotte de uitkomsten in een verhaal kunnen plaatsen en duidelijk kunnen maken aan de eindgebruiker, die vaak weinig begrip heeft van zowel IT als de informatie-analyse zelf. Het team zal business skills moeten hebben om de aanbevelingen aan de business te verwoorden en te presenteren.

 

Er waren prachtige voorbeelden van bedrijven en organisaties die al veel op dit gebied doen. Vanuit de medische wereld hoe men ziektes en epidemieën beter en vooral sneller kan ontdekken door het volgen van berichten op sociale media en wereldwijd in de lokale pers. Of uit de wereld van financiële services waar klanten kunnen worden geholpen met adviezen hoe vergelijkbare personen in hun regio met eenzelfde levensstandaard hun uitgaven doen. Men noemt dat ‘Big Data for the little guy’. Privacy is in al deze voorbeelden een groot goed. Deze bedrijven hebben data van hun klanten in huis, en dat is dus niet hun eigen data. Daar moet men zeer bewust op zijn en dit streng in het bedrijfsbeleid verankeren. Vertrouwen is de basis, privacy is heilig.

 

Er waren ook voorbeelden uit de sport hoe men met data-analyse de prestaties van spelers en het team kan verbeteren. Men bouwt zelfs al sensoren in de bal, om nog meer te weten over de snelheid, versnelling en beweging die spelers daaraan meegeven. Duizenden metingen per seconde die men tijdens de wedstrijd vastlegt om analyses uit te voeren en de prestaties te verbeteren.

Daarnaast natuurlijk de retail-informatie die gebruikt wordt om proactief potentiële klanten aan te trekken. Als je in de buurt van de winkel bent al een berichtje krijgen over een aanbieding van je favoriete product. Een enorm proces van ruwe data verzamelen, daar de data-mining signalen uit te filteren en die aan voorspellende algoritmes te voeden. Elke dag weer.

 

Visualisatie
De kunst van het data science team is dat ze al deze uitkomsten op een begrijpelijke en overzichtelijke manier kunnen presenteren. In een data science team nemen dan ook steeds vaker ontwerpers plaats die deze rol op zich nemen. Het bekende: ‘A picture paints a Thousand Words’. In sommige ontwikkelingsgebieden kunnen op die manier burgers beter worden geïnformeerd over hun eigen omgeving, op basis van wat er allemaal – ten goede en ten kwade – verandert in hun leefomgeving. Goede visualisatie democratiseert de uitkomsten van Big Data en maakt complexe zaken makkelijker publiek begrijpelijk.

 

Kern data science
Data science is een heel breed begrip dat op alle gebieden van de markt en maatschappij zijn weg gaat vinden. Maar, als de brondata niet goed is, kun je het ook niet aggregeren naar iets beters en mooiers. De kern van data science is het gebruiken van goede bronnen. Daarnaast is privacy een groot goed. Big Data en ethiek moeten met elkaar verbonden zijn. De software waarmee we deze analyses doen, moet dus ook een ethische toets krijgen. Niet alleen wat betreft de analyse zelf, maar ook wat betreft de uitkomsten en hun presentatie. Dus nog een andere eigenschap die het data scientist team moet hebben: verdieping en zelfreflectie. Een soort social engineering waarmee zij de brug slaan tussen de maatschappij en de ons omringende data. Een sterk staaltje team work dus.

Verstuur dit artikel naar Google+

Reageer op dit artikel
















Even geduld a.u.b.

Afbeelding

EMC Computer Systems (Benelux)

Edisonbaan 14 B, 3439 MN Nieuwegein

www.netherlands.emc.com / www.datacentered.nl

netherlands@emc.com

 

Afbeelding Afbeelding Afbeelding