Managed hosting door True
Deze opinie is van een externe deskundige. De inhoud vertegenwoordigt dus niet noodzakelijk het redactionele gedachtegoed van de redactie.

Big data neemt een enorme vlucht

Het is begonnen met SaaS, gevolgd door cloud en social media en grootschalig wetenschappelijke (gezondheid en ruimtevaart vooral) onderzoeken. Big data is geboren, big data neemt een enorme vlucht, big data is een evolutie in de geschiedenis...

Big data era om mee te vliegen...

Zowel de huidige telecomconsumenten als de ict-ontwikkelingsmarkten gaan straks net iets anders functioneren dan wat wij gewend zijn. De klassieke manier van applicaties bouwen, data beheren en opslag worden geschiedenis. Alles wordt snel, eenvoudig, voor iedereen bereikbaar en visueel. Alles draait om van tevoren te weten wat straks aan consumenten geboden wordt.

Het motto: Business In Future 

Hardwareproducenten willen kleinere, zeer snelle dataopslag en processors maken met nog minder investering voor de consumenten. Dat komt doordat elk jaar data die opgeslagen is 40 procent groeit. Wat zal dat dan straks voor mkb’ers en grotere bedrijven betekenen? Of voor bedrijven die direct te maken hebben met partijen zoals Bol.com, Wehkamp, luchtvaartmaatschappijen, telecombedrijven, et cetera?

Wij zullen ons moeten voorbereiden op deze aankomende innovatie, ons bewust zijn van wat voor soort bedrijfsdata wij thuis hebben en wat die data doet voor de visie en strategie van het bedrijf en wat dit betekent binnen gewenste investeringsgrenzen. Aan de ene kant willen wij meer en meer kwalitatief goede data uit de enterprise gegevens halen, aan de andere kant wil men maatregelen nemen voor de razendsnel groeiende dataopslag.

Iedereen heeft het er tegenwoordig over dat big data een hype wordt, maar men weet weinig over big data. In enkele woorden is big data alles wat gedigitaliseerd is. Dat kunnen bijvoorbeeld simpele supermarktboodschappen zijn, opnamen met de securitycam, de sales lead die via bedrijfswebpagina gegenereerd is of gegevens uit social media. Maar waarom is het 'big'?

Dit is omdat ongestructureerde data wordt gekoppeld aan gestructuurde data. Dataopslag groeit per jaar meer dan 40 procent op dit moment. Dat betekent dat beheren van die data of processing van die data ook duurder wordt. Ook zijn grote data sets qua volume te groot om binnen traditionele datastorage met processors te behandelen. Met de nieuwe big data-technieken zijn massadata in stukjes geknipt en geclusterd, zodat de dataprocessnelheid is verbeterd en data-analytics als geheel is geïmplementeerd.

Een traditioneel enterprise datawarehouse zal als big data-oplossing 2,5 keer meer datastoragekosten met zich mee brengen. Real time analysis kan bereikt worden, zodat enterprises ook realtime acties kunnen ondernemen. Hun klanten kunnen ook profiteren van predictive analytics. Als er bijvoorbeeld een storm verwacht wordt, beïnvloedt dat de datakwaliteit in datatransmissie bij betalingen. Dat is van belang voor banken. Daarnaast krijgen bedrijven meer inzicht in hun business en willen ze de datasilo tussen de businessafdelingen afbreken. Zodoende krijgt het C-level management breder inzicht in de zaken, terwijl businessafdelingen nog betrouwbaardere gegevens ontvangen. Zodoende wordt nog meer Ddata breder gevisualiseerd.

Wat zal dat straks voor bedrijven betekenen? Het management moet inzicht krijgen in datatransparantie, moet data kunnen relateren, moet data veilig kunnen stellen voor binnen en buiten de enterprise. Het allerbelangrijkste is om consumenten tijdig te informeren over het productieportfolio, dynamische prijsstelling en het verbeteren van de klantenservice.

Voor het grote publiek betekent dit bijvoorbeeld op maat aangemaakte medicijnen, extra veilig autorijden, etc., maar je moet wel blijven opletten dat je privégegevens en productvoorkeur niet op internet bekend is. Voor de technologie betekent dit dat de snelheid in wetenschappelijke analyses en onderzoeken enorm toeneemt. Project die voorheen in meerdere jaren gerealiseerd werden, kunnen nu binnen enkele dagen afgerond worden, zo ver is het technologie.

Om tot predictive analytics te komen, zijn er binnen big data analytics twee methoden samengevoegd. Om patronen te vinden heb je machine learning code en data mining. In machine learning code worden 'bekende' waarden en patronen in data gezocht. Deze worden wat vaker in wetenschappelijke onderzoeken gebruikt, zoals die van Cern. In data mining worden 'onbekende' waarden en patronen gezocht, proberen we nieuwe waarden te creëren uit onbekende of zoeken we oorzaken voor bekende events en patronen.

Business intelligence is een onderdeel van big data, maar bi is niet voldoende om grootschalig data te analyseren, definiëren of realtime analytics te kunnen doen. Ook kan je niet realtime acties ondernemen tot de einddeur bij de klant. Met predictive analytics van big data kunnen dit soort zaken wel gemeten en zichtbaar gemaakt worden.

De grootste handicap in big data is het gat tussen businessmanagers en ict. Duidelijke big data-strategieën moeten opgesteld worden, er moet geanalyseerd worden welke data in het bedrijf aanwezig zijn en moet de hoeveelheid van die data voldoende kwalitatief zijn voordat er met big data-projecten begonnen wordt.

Soms kan het zijn dat het businessdoel van het bedrijf niet in big data-mogelijkheden past. Dan zijn er concrete targets nodig vanuit de business. Die kunnen vanuit ict worden ingevuld met aanvullende requirements-analyses.

Meer over dit onderwerp is te lezen (in het Engels) op http://www.facetobusiness.com/bdt/images/arzubbigdatawhitepaper.pdf.

Dit artikel is afkomstig van Computable.nl (https://www.computable.nl/artikel/4746880). © Jaarbeurs IT Media.
?

 

Reacties

Ook in dit artikel wederom geen uitleg waarom Big Data geen hype is.

"Het management moet inzicht krijgen in datatransparantie, moet data kunnen relateren, moet data veilig kunnen stellen voor binnen en buiten de enterprise."
Hier zit precies het pijnpunt van de big data hype: je moet wel precies weten wat je er uit wil hebben en dat is veel moeilijker dan iedereen verkondigt. Ook hier geldt weer: IT moet geen doel op zich zijn!

"Het allerbelangrijkste is om consumenten tijdig te informeren over het productieportfolio, dynamische prijsstelling en het verbeteren van de klantenservice."
Bij juiste bedrijdsvoering heb je helemaal geen big data hiervoor nodig.

Ben Elton schreef in 2008 het boek "Blind Faith". De hoofdpersoon in dit fantastische verhaal heeft als baan het zoeken van de meest onzinnige (nog niet eerder gevonden) relaties tussen data. Een aanrader...

Ik ben het met Jeroen eens.
Wat bedoelt de auteur precies met gestructureerde en ongestructureerde data? Data is mooi, maar het is pas werkbaar als het te gebruiken is, en dan is het informatie.
Er wordt al heel lang met grote stukken data gewerkt (marktonderzoeken, epidemiologie etc.), maar sinds dat er computers zijn en er steeds betere processors komen, kunnen we de grote datahoeveelheid sneller onderzoeken.
Maar data is nog geen informatie.
IT is hierbij slecht een hulpmiddel om van data informatie te maken, masar dan moet je wel geschikte data hebben.
Anders ben je nog steeds een fool met een tool.

Arzu,

Predictive analytics is een pseudowetenschap want bij betrouwbare gegevens gaat het niet om de data of de omvang maar de foutloze meting en de controleerbaarheid. Een voorbeeld:

1. Er staat een bord langs de weg met 100.
2. Mijn snelheidsmeter geeft 120 aan.

Eén en twee bij elkaar opgeteld is de informatie dus dat ik te hard rij en met geautomatiseerd sanctieproces van trajectcontrole daarom een boete krijg.

Dezelfde case maar nu met andere parameters:

1. Er staat een bord langs de weg met 100.
2. Mijn snelheidsmeter geeft 100 aan.

Eén en twee bij elkaar opgeteld is de informatie dat ik NIET te hard rij maar toch krijg ik een bekeuring omdat er een fout zit in de software waardoor mijn auto aangezien wordt als vrachtwagen of bestelbus.

Nu zal trajectcontrole misschien geen best voorbeeld zijn van Big Data maar het gaat erom dat meetfouten tot vervelende consequenties kunnen leiden. Iets waar trouwens het CERN ook achter kwam toen ze te vroeg iets riepen over de snelheid van het licht door een meetfout.

Snelheid en betrouwbaarheid gaan dan ook vaak slecht met elkaar samen, zeker als ook de reproduceerbaarheid ontbreekt. Predictive analytics voor business managers is dus gewoon astrologie, niet meer dan een horoscoop. En stellen dat grootste handicap in Big Data het gat tussen business(managers) en IT is lijkt me van een tunnelvisie getuigen omdat de spanning vooral zit in te kleine budgetten.

Iedereen snapt wel dat als je dingen weet (data - feiten - bewijs), dat je op basis daarvan betere beslissingen kunt maken als dat je het alleen maar op gevoel doet.

Maar met dit soort artikelen zie ik sterke relatie met cloud computing eerder. Iedereen roept er van alles over, maar doordat er maar weinigen concreet zijn blijft het allemaal nodeloze bla bla en lege retoriek.

"Big data neemt een enorme vlucht" - wat zegt dat nou? Wie zit daar nu op te wachten?

Pak een specifiek onderwerp en schrijf daar iets zinnigs over, ik zal een paar suggesties doen:
- Hoe realiseer je "machine learning code"
- Waar sla je je data op en tegen welke problemen loop je daar aan?
- Noem voorbeelden waarin "big data" succesvol is en beschrijf wat daar bij kwam kijken
- Welke technieken gebruik je om real time analyses te doen
- Welke tools zijn er momenteel en wat daar de zwakke en sterke kanten
- Wat is een stappenplan om waarde te halen uit Big Data?
- Welke technieken voor verwerking hebben de toekomst?

Zo maar wat suggesties die in mijn ogen hout snijden. Ofwel, noem man en paard als je over big data praat.

En als teaser, onderbouw jouw stelling "maar bi is niet voldoende om grootschalig data te analyseren"

Arzu,

Welkom! En goed te zien dat je bent gaan schrijven. Echter deel ik wel de mening van Henri. Je artikel is wel heel erg hoog over. De tips die Henri geeft zijn zeer bruikbaar. Dus ik kijk uit naar je 2e artikel waar je hier verder op in kan gaan. Want big data is een hot topic.

:), meer te lezen is in het Whitepaper. Daar is het breder opgepakt. uitgelegd waarom het geen hype is.
- Unstructureerd data kan door meerdere data chanells gegeneerd worden
- Her gaat over Data Transparancy, afbreken Silo's, Visualiseren, Reduceren kosten met slimme opslag & slimme Analytics en reflecteren in Social Media als het wens is.
- De grootste handicap in Big Data is dat er weinig uniform standards vast kunnen gelegd worden. Elke Big Data case is Unique, per business segment & Business strategie factoren & Data channels componenten zijn verschillend per situatie.Bedrijven zullen duidelijke Big Data visie hebben, niet zomaar sprongen naar een grote data ocean zonder een goede voorstudy analysis.

@Arzu Bedankt voor je reactie
Ik dacht al dat er in je WP meer zou staan.
Ik zal het dit weekend bestuderen en dan krijg je komende week feedback :)
Mooi dat je het oppakt binnen Computable

@arzu

Ik snap de Whitepaper-insteek en daarmee het gebruik van een aantal "mainstream"-termen welke bij het concept "Big Data" horen. Ik had alleen een wat verdere uitdieping van het concept graag terug willen zien in dit artikel. Maar mogelijk wordt daarmee de doelgroep van computable.nl niet bereikt.

Ik ben daarom ook van mening, net zoals Henri Koppen, dat dit artikel met een meer praktische invulling geschreven had kunnen worden. Bijvoorbeeld de toepassing van NoSQL, Hadoop bij een grote corporatie zoals Facebook of Google. Daarnaast zou een voorbeeld/voorstel van een BigData-model een welkome additie zijn met daarbij de vraag welke bestaande (of nog te ontwikkelen) modellerings-technieken hier mee uit de voeten zouden kunnen. Hetgeen discussie op gang kan brengen.

Wat betreft het concept “data mining” en dit toe te passen op ongestructureerde data, ben ik het niet helemaal met je eens. Wanneer men, op welke manier dan ook, tracht ongestructureerde data (inhoud van een tweet, facebook-post, product-review o.i.d ) middels algoritmen te analyseren, welke veelal onder de noemers "social mining", "opinion mining", “linguistic engineering” en "text-mining" vallen, zal er altijd een bepaalde structuur aan de "ongestructureerde" data worden geven. Hetgeen de term "ongestructureerde data" ter discussie stelt.

Een stelling zou kunnen zijn dat er enkel met grote gestructureerde datasets wordt gewerkt. Maar deze worden niet ongestructureerd /real-time geanalyseerd daar algoritmen uitgaan van variabelen en specifieke mathematische functies. Hetgeen een dataset vereist welke dusdanig gestructureerd is zodat een algoritme er mee kan werken.

daarnaast zal data inderdaad in de juiste context geplaatst moeten worden om hier naar te kunnen handelen. Enkel hebben bedrijven al de grootste moeite met het interpreteren van data welke in hun IT-systemen zit, laat staan externe "ongestructureerde" data uit andere omgevingen. Dit wordt ook wel de "Information Gap" genoemd.

Wat vind je van bovenstaande stelling?

Hoe zou het komen dat ik bij het lezen van:" Alles wordt snel, eenvoudig, voor iedereen bereikbaar en visueel."
een flashback naar 20 jaar geleden krijg?

Beste Arzu,

Aangezien je opinie een samenvatting van je White Paper (WP) is blijven meest gestelde vragen nog steeds onbeantwoord. De opsommingen geven dus even weinig onderbouwing en gaan al helemaal niet in op de keerzijde van 'big' waardoor er een tunnelvisie ontstaat. Argument dat we silo's af moeten breken heb ik trouwens al eens gehoord en SOX was hier een antwoord op.

Technisch is er misschien veel mogelijk maar juridisch en maatschappelijk blijven andere domeinen die vaak nog weleens vergeten worden. En nu bekend wordt dat automatische sanctieproces van trajectcontrole niet alleen software fouten kent maar ook extra administratieve kosten om deze te herstellen vraag ik me af wat (of voor wie) nu de winst en het verlies hiervan is.

Maar ik wens je veel data;-)

Arzu,
Om te beginnen BD is niet begonnen met SaaS! Dit verschijnsel bestaat al lang, zoals bij woningcorporaties. Probeer daar hun DWH overzichtelijk te maken.

Ik ben het met je eens dat het de grootste handicap in Big Data is dat er weinig uniform standards vast kunnen gelegd worden. Dit wordt de komende jaren met de komst van "The Internet Of Things" nog erger. In dit geval krijg je verschillende datastromen waar geen structuur, uniformiteit, coherentie en relatie tussen zitten.

BI zal in dit geval een grote uitdaging hebben. Wie kan van dit dataoerwoud geld maken? Uiteraard bedrijven zoals Google!

"big data is een evolutie in de geschiedenis."
zou dat zelf verzonnen zijn of komt dat ook uit dat white paper ?

Kunnen we niet gewoon een groot artikel maken dat al die flauwekul in een keer meeneemt en dat we er dan vanaf zijn ?

De titel : Vervroegde outsourcing van big data in de cloud, tgv het verwachte tekort aan technici, geen oplossing voor kloof tussen business en ICT.

Ik heb al vaker geroepen, doe dit nu weer, even los van de criticasters die stellen dat big data 'hype'is, het is een onbetrouwbaar fenomeen.

Je hebt namelijk geen onderbouwde toetsing die je kunt gebruiken om te zien of de door jou geextraheerde data wel correct is dus kun je niet anders dan 'aannemen dat...'

Dat dat de nodige consequenties kan opleveren zie je nu al gebeuren getuige de vele publicatis in HR en recruitment land hoe belangrijk toch facebook, linkedin etc zou zijn in het sollicitatie proces.

We zien het ook weer terug in de vele pretentieuse publicaties waarbij men commercieel stelt zo verschrikkelijk succesvol te zijn en je ziet het redelijk vaak terug bij bepaalde teneurs in publicaties van alleen al computable.

Als er al enige betrouwbaarheid te extraheren is zou de methode wellicht die vermaledijde cookies kunnen zijn. Maar om die dan ook maar als 'betrouwbaar' om zeep te halen, ik donder die weg bij het afsluiten waardoor dergelijke data dus ook onbetrouwbaar mag worden geacht. Er zijn er namelijk genoeg die dat doen.

Het is weer zomer begrijp ik. Geen eigen originele kopij, met lle respect, beetje jammer.

Arzu, ik heb de whitepaper gelezen. Er staat inderdaad meer in dan waar je nu over schrijft. Het is op zich ook een degelijk stuk en een goed handvat als je begint met orienteren.

“maar bi is niet voldoende om grootschalig data te analyseren" - begrijp ik het goed dat dit vooral komt doordat traditionele BI tools gericht zijn op gestructureerde data zoals relationele databases? Je schrijft ook dat big data een extra staging area nodig heeft, maar ik denk dat dit niet inherent is aan big data.

Je schrijft dat het een grote vlucht gaat nemen en hoewel ik hier in de basis wel mee eens ben, denk ik dat de obstakels en risico's voor kapitaal vernietiging aanwezig is. De kosten zijn hoog door gebrek aan standaard, gebruik van nieuwe techologie zal in veel gevallen niet opbrengen wat men ervan verwacht had. Je hebt algoritmes nodig. Die zelf ontwikkelen zijn (extreem) duur, licenties nemen op bestaande licenties een kostbare zaak omdat er weinig afnemers zijn. Data kun je niet zo maar kopen. Mensen denken wel eens dat Google je persoonlijke data verkoopt, maar dit is niet waar. Niet ieder bedrijf leent zich ervoor om nuttige big data te verzamelen. Analyse van ruwe data staat nog echt in kinderschoenen.

Maar zelfs Facebook die enorm veel van mij zou kunnen weten krijgt het niet voor elkaar om mij iets zinnigs te tonen waarop ik wil klikken en Google doet het echt niet veel beter. Natuurlijk als ik iets zoek weten ze mij zinvolle advertenties te tonen. Maar als ik een stukje schrijf over een bedrijf wordt ik nog weken achtervolgd met diens advertenties.

Dus ja “big data” is een grote belofte, ook is het niet zo zeer een hype maar gewoon fact. Maar met “big data” neemt een enorme vlucht is verkoop praat. Je probeert iets te verkopen. Dat is niet erg, maar zonder substantie krijgt het snel een slecht imago.

Niettemin is het een vertrekpunt en kijk ik uit naar je volgende artikelen en zal ik ze zeker lezen!

Arzu,

je hebt een gedetailleerd whitepaper geschreven wat naar mijn mening vooral een reclamestuk is.
Helaas geef je geen bronnen weer bij de 'feiten'die je geeft, heel jammer omdat je dan geen achtergrondinfo kunt zoeken voor toetsing van je verhaal.
Daarnaast vraag ik me nog steeds af wat semi-structured data is wat je in je WP aanhaalt, het wordt meerdere keren genoemd, maar nergens staat wat het nu precies is.
Zoals Henri al aangaf, veel verkoop maar weinig substantie. Jammer, had meer verwacht.
Maar misschien dat het wel andere experts triggert een goed verhaal over
BIG DATA te gaan schrijven met INHOUD en bronvermelding!!

Henri,
Met de huidige BI tools en werkwijze kun je niet de big data van de toekomst oplossen. De big data zoals ik eerder in andere artikelen heb aangegeven zal ingehaald worden door nanodata! De ontwikkelingen zoals TIOT zullen hier veel effect op hebben.
Ik ben het met je eens dat het verwerken van BD/ND in de toekomst veel gaat kosten. Daarom heb ik in mijn reactie hierboven aangegeven dat bedrijven zoals Google hier zullen geld van kunnen maken en niet elke MKB.
BI zal de komende 5 jaar veel ontwikkelingen op het gebied van computing en software meemaken. Ondanks dit verwacht ik niet dat je als MKB met deze tools en ontwikkeling gebaseerd op verschillende datastromen, je bigdata of nanodata kan analyseren. Dit blijft de kracht van grote bedrijven zoals Google, IBM of HP.

Hey Reza,

ik denk dat je naar dit artikel over nanodata refereert:

http://computerworld.nl/big-data/75507-big-data-wordt-ingehaald-door-nanodata

nanodata, is dat niet de heilige graal voor de marketingprofessionals??

Cordny,
Verwacht niet veel anders wordt je snel teleurgesteld!
Bij het lezen van dit artikel was het me snel duidelijk dat 90% van dit artikel een reclame was. Dat merk je ook aan korte interactie van Arzu met de lezers met weinig onderbouwing. Je kunt er rustig vanuit gaan dat achter dit artikel een reclame/PR bureau zit.

Ik geniet meer van de reacties op dit artikel dan de inhoud van het artikel zelf!

Cordny,
Dit artikel heb ik een tijd geleden in de reactie van Maarten Oberman gezien.
Ja/Nee! Ik verwijs (indirect) naar de inhoud van dit artikel maar mijn reactie is gebaseerd op een bijeenkomst dat ik langgeleden over dit onderwerp (Nanodata) bijgewoond heb.

Leuk dat je deze informatie gevonden hebt en met anderen deelt. Ik denk dat dit interessant is voor Henri!

Nog even reagerend op de term "predictive analysis". In het kader van Cloud Computing heb ik een onderzoek laten uitvoeren door een student van de UU over "Cloud Cost Forcasting". Niet helemaal on-topic t.a.v. Big Data, maar het gaat me hier even over het voorspellen. Wat bleek uit het onderzoek is dat voor het voorspellen diverse algorithmen bekend zijn en voor ons doel er 2 geschikt waren:
- Extrapolation models
- Quantitative analogies
De eerste bouwt voort op gegevens die al bekend zijn, iets wat we vaak inituitief doen, extrapoleren. Probleem is echter dat bij complexe data de voorspellende waarde drastisch afneemt naarmate je verder vooruit kijkt (herkenbaar bij weersvoorspelling).
De tweede kijkt naar bekende data en probeert die te vergelijken met de huidige data en aan de hand van resultaten uit het verleden iets te zeggen over de toekomst. Ook herkenbaar uit de financiele wereld.

Al met al bleek het extreem moeilijk om uit beschikbare data iets te zeggen over de toekomst. Dan terug naar Big Data: het ter beschikking hebben van data is wel een voorwaarde voor predictive analysis, maar de betrouwbaarheid van welke voorspelling dan ook is erg laag.
Misschien dat Big Data-experts me kunnen overtuigen dat het beter kan, maar voorlopig zie ik niet meer dan mogelijkheden voor trend analyses die met veel slagen om de arm tot besluitvorming kunnen leiden.

Leen,

ik benoem wat betreft predictive analysis altijd 1 uitspraak:
Resultaten uit het verleden bieden nog geen garantie voor de toekomst. :)

@Leen: zeer relevante en knappe reactie. Die steek ik in mijn zak! Je verwoord het erg praktisch en veelzeggend.

Niettemin geloof ik in de waarde van data. Een zeer leuke film gebasseerd op echte gebeurtenissen is Moneyball met o.a. Brad Pitt. Het gaat dan wellicht niet om big data, maar wel om het samenbrengen van gegevens en deze combineren, de predictive value daarvan was zo groot, dan de gehele industrie is verandert in een tijdbestek van 2 jaar.

Ook de data die de Nederlandse honkballers gebruiken met analyse zijn voor een deel heel ongestructureerd in die zin dat ze niet in relationele tabellen passen.

Het onderbouwt in ieder geval de casus voor het gebruiken van data.

Maar net zoals search engines nog vrij dom zijn, duurt het nog jaren voordat big data "easy" word. En daarin verschilt het dus behoorlijk van bijvoorbeeld cloud computing welke wel praktisch toepasbaar is.

Nanodata lijkt me overigens anders dan big data, niettemin leuk om te lezen, thanks!

Reza ben het eens met je reactie van 09:53.

Sorry, maar in dit artikel (en ook het whitepaper) tracht ik tevergeefs de inhoud van de reclame te scheiden. De stukken wekken sterk de indruk niet zozeer vanuit een inhoudelijke als wel vanuit een communicatie invalshoek geschreven te zijn, getuige het dominate gebruik van (overigens slecht gedefinieerde) buzzwords.

Zowel het artikel als het whitepaper ademen ook de sfeer van 'big data is a lazy incompetent's delight', d.w.z. u hoeft niet meer zelf na te denken of kennis te hebben, automaten en 'big data' kunnen dat beter en zullen dat voor u doen. Het moge duidelijk zijn dat het niet zo werkt.

Zelf houdt ik mij beroepsmatig bezig met data-analyse, en zie ik in toenemende mate mensen in deze valkuil trappen: ingewikkelde modellen (die zij niet snappen maar als black box hanteren) op grote hoeveelheden ongerichte data loslaten. Door hun complexiteit hebben dat soort modellen prima in-sample performance (d.w.z. op de trainingsdataset), en slechte out-of-sample performance door ondeugdelijke modellering (d.w.z. niet beter en soms veel slechter dan een simpel model plus wat gezond verstand). Resultaat: verloren tijd.

Verder zie ik bij bedrijven veel meer als bottleneck een gebrek aan deugdelijk inzicht in hoe hun eigen bedrijf en de wereld om hen heen werken (de meeste bedrijven zijn helemaal niet 'excellent'). Dat komt niet door gebrek aan data) maar onvermogen om hun reeds beschikbare (gestructureerde) data te analyseren om daaruit bruikbare informatie te peuren. Een tweede bottleneck is hoe goede informatie te gebruiken en daadwerkelijk te gelde te maken.

Big Data is geen kwaliteit op zich. Data is informatief, of is dat niet. En jawel, proceslogs genereren grote hoeveelheden data die soms wat zinnigs kunnen zeggen over individueel gedrag, wat dan weer middels gerichte, zinnige vragen tot resultaat zou kunnen leiden. Daar ligt de crux. Dat het daarbij soms om 'Big' data gaat is bijzaak.

Rekenkracht en data hoeveelheid (wel of geen 'Big Data') is niet beslissend. Commercieel inzicht, ondernemingsgeest, marktkennis, daadkracht, en helder nadenken zijn dat wel.

Ik begrijp jullie frustratie, misschien willen jullie experten huren, zodat de gratis Business Service die jullie in publiek opinie artikel of in gratis Whitepaper verwachten, kan geregeld. Ik heb geen reclame nodig trouwens. Ik ben een van de eerste die over Big Data in Nederland geroepen is... Ik zit regelmatig te brainstormen met Nederlandse & internationale Big data experten, Conference organizators, AI wetenschappers, of Entrepreneurs.
Ik bouw zelf niks, ik ben Business Strategy & Visie ontwerper die gebaseerd is op Big Data.
In een publiek opinie artikel of in een Gratis Whitepaper, krijg jij geen Gratis Business Service. in een Whitepaper krijg je zoiso geen gratis analysis, wat ik al extra gestopt heb.
Ik organiseer trouwens Big Data Security Training in October, er komt een echte ervaarde Big data Expert uit Silicon Valley om les te geven, als echter jullie willen iets leren, kunnen jullie jullie inschrijven...Daarnaast, organizeer ook een Internationaal Big Data conference met een Europese Event organisatie in Istanbul maar dat is beetje ver om te reizen voor jullie... :)...

Computable Expert
Arzu  Barské

Arzu Barské
Product Manager [eHealth | Smart Digital Solutions ] | Big Data Strategist , Engie. Expert van Computable voor het topic Development.
Hele profiel

Vacatures

Stuur door

Stuur dit artikel door

Je naam ontbreekt
Je e-mailadres ontbreekt
De naam van de ontvanger ontbreekt
Het e-mailadres van de ontvanger ontbreekt

×
×