Ontwikkeling uitstroomprofiel Big Data & Data Science

We leven in de tijd van Big Data. Big Data is niet alleen groot, maar ook complex, gevarieerd en vaak in realtime. Vanaf cursusjaar 2012-2013 is bij de opleiding Informatica van cmi het uitstroomprofiel Big Data / Data Science opgestart. Hier is veel behoefte aan.

Zo voorspelt McKinsey in het rapport ‘Big Data: the next frontier for innovation, competition and productivity’ dat er in 2018 in de vs een tekort zal zijn van 140.000 tot 190.000 mensen met ‘deep analytical skills’ – hierbij gaat het met name om wiskunde, statistiek en machine learning.

Op het gebied van digitaal opgeslagen gegevens hebben we de afgelopen twintig jaar een spectaculaire ontwikkeling gezien. Vroeger werden vooral transactiegegevens opgeslagen, maar tegenwoordig wordt elke muisklik van elke internetgebruiker opgeslagen. Tegelijkertijd is het gebruik van data veranderd. Oorspronkelijk werden standaardrapportages gemaakt (bijvoorbeeld van verkoopcijfers); vanaf de jaren 1990 werden datawarehouses ingericht om patronen te ontdekken in data, en tegenwoordig willen we niet alleen in real-time weten wat er gebeurt, maar willen we bij voorkeur ook weten wat er in de toekomst gaat gebeuren. Googles ceo Eric Schmidt zei over dit onderwerp in 2012: “Google needs to move beyond the current search format of you entering a query and getting 10 results. The ideal would be us knowing what you want before you search for it.”

Zowel de data-infrastructuur als de huidige kennis onder informatici is veelal ontoereikend om met big data om te gaan. In het webinar ‘Pattern- Based Strategy: Getting Value from Big Data’ concluderen analisten Genovese en Beyer van Gartner dat de bestaande datawarehouse-architectuur ongeschikt is voor Big Data.

Googles Chief Economist Hal Varian formuleerde de behoefte aan experts op het gebied van big data als volgt: “The ability to take data – to be able to understand it, to process it, to extract value from it, to visualize it, to communicate it – that’s going to be a hugely important skill in the next decades.”

cmi start vanaf cursusjaar 2012-2013 met het uitstroomprofiel Big Data / Data Science voor de opleiding Informatica. Dit profiel omvat:

  • data-analyse (wiskunde, statistiek, machine learning)
  • software-infrastructuur voor distributed data opslag en verwerking (Hadoop en applicaties)
  • datavisualisatie

Literatuur:

  • Pattern-Based Strategy: Getting Value from Big Data. Y. Genovese, M. Beyer. July 2011. my.gartner.com/portal/server.pt?open=512&obj ID=202&mode=2&PageID=5553&resId=1727219 &ref=Webinar-Calendar)
  • McKinsey Global Institute. Big Data: The next frontier for innovation, competition, and productivity. May 2011. www.mckinsey.com/mgi/publications/big_data/
  • Building Data Science Teams. DJ Patil. O’Reilly Media / Radar. September 2011. shop.oreilly.com/product/0636920022770.do
  • Big Data Now: Current Perspectives from O’Reilly Radar. O’Reilly Radar Team. O’Reilly Media. August 2011. shop.oreilly.com/product/0636920022640.do, radar.oreilly.com/2010/06/what-is-data-science. Analysis: The future belongs to the companies and people that turn data in to products. radar.oreilly.com/mikel/index.html Mike Loukides cdn.oreilly.com/radar/2010/06/What_is_Data_ Science.pdf