Wat presies is 'groot data'?

En waarom is dit 'n groot deal?

'Groot data' is die nuwe wetenskap van die verstaan ​​en voorspel van menslike gedrag deur groot hoeveelhede ongestruktureerde data te bestudeer. Groot data staan ​​ook bekend as 'voorspellende analise'.

Ontleding van Twitter-plasings, Facebook-feeds, eBay-soektogte, GPS-spoorsnyers en OTM-masjiene is enkele groot data voorbeelde. Die studeer van sekuriteitsvideo's, verkeer data, weerpatrone, vlug aankomste, selfoon toring logs, en hartklop trackers is ander vorme. Groot data is 'n morsige nuwe wetenskap wat weekliks verander, en net 'n paar kenners verstaan ​​dit alles.

Wat is 'n paar voorbeelde van groot data in gereelde lewe?

skermkiekie http://project.wnyc.org/transit-time

Terwyl die meeste groot data-projekte baie duister is, is daar suksesvolle voorbeelde van groot data wat die alledaagse lewe van individue, maatskappye en regerings beïnvloed:

Voorspelde virusuitbrake: deur sosio-politieke data, weer- en klimaatdata en hospitaal- / kliniese data te bestudeer, voorspel hierdie wetenskaplikes nou die uitbrake van die koorsuitslag met 4 weke vooraf kennisgewing.

Homicide Watch: hierdie groot data projek profiele vermoor slagoffers, verdagtes en misdadigers in Washington, DC. Beide as 'n manier om die oorledene te eer en as 'n bewusmakingsbron vir mense, is hierdie groot data-projek fassinerend.

Transit Travel Planning, NYC: WNYC radio programmeerder Steve Melendez het die aanlyn metro skedule gekombineer met reisroetesagteware. Sy skepping laat New Yorkers kliek op hul ligging op die kaart, en 'n voorspelling van die reistyd vir treine en metro sal voorkom.

Xerox het hul arbeidsmagverlies verminder: werksentrumwerk is emosioneel uitputtend. Xerox het met behulp van professionele ontleders reamme data bestudeer, en nou kan hulle voorspel watter oproepsentrum gehuur word, waarskynlik die langste by die maatskappy bly.

Ondersteunende teen-terrorisme: deur die bestudering van sosiale media, finansiële rekords, vlugte en sekuriteitsdata, kan wetstoepassing terroristeverdagtes voorspel en opspoor voordat hulle hul goddelose dade doen.

Die aanpassing van handelsmerkbemarking gebaseer op sosiale media-resensies : mense deel hul aanlyn gedagtes op 'n kroeg, restaurant of fiksheidsklub heeltemal en vinnig. Dit is moontlik om hierdie miljoene sosiale media poste te bestudeer en terugvoer te gee aan die maatskappy oor wat mense van hul dienste dink.

Wie gebruik groot data? Wat doen hulle daarmee?

Baie monolitiese maatskappye gebruik groot data om hul aanbiedinge en pryse aan te pas om klantetevredenheid te maksimeer.

Hoekom is Big Data so 'n groot deal?

4 dinge maak groot data beduidend:

1. Die data is massief. Dit sal nie op ' n enkele hardeskyf pas nie , veel minder 'n USB-stok . Die hoeveelheid data is veel groter as wat die menslike verstand kan waarneem (dink aan 'n miljard biljoen megabytes, en vermeerder dit dan met meer biljoene).

2. Die data is rommelig en ongestruktureerd. 50% tot 80% van die groot data werk is die omskakeling en skoonmaak van die inligting sodat dit soekbaar en sorteerbaar is. Net 'n paar duisend kenners op ons planeet weet ten volle hoe om hierdie data op te ruim. Hierdie kundiges het ook baie gespesialiseerde gereedskap nodig, soos HPE en Hadoop, om hul handwerk te doen. Miskien oor 10 jaar sal groot data-kundiges 'n dime 'n dosyn word, maar vir nou is dit 'n baie seldsame soort ontleder en hul werk is nog steeds baie onduidelik en vervelig.

3. Data het 'n kommoditeit geword ** wat verkoop en gekoop kan word. Data markte bestaan ​​waar maatskappye en individue terabytes van sosiale media en ander data kan koop. Die meeste van die data is wolkgebaseer, aangesien dit te groot is om op enige enkele hardeskyf te pas. Om data te koop, behels gewoonlik 'n intekenfooi waar jy in 'n wolkbedienerplaas aansluit.

** Die leiers van groot data gereedskap en idees is Amazon, Google, Facebook en Yahoo. Aangesien hierdie maatskappye soveel miljoene mense bedien met hul aanlyndienste, maak dit sin dat hulle die versamelpunt en die visioenêre agter groot data-analise sal wees.

4. Die moontlikhede van groot data is eindeloos. Miskien sal dokters eendag hartaanvalle en beroertes vir individue weke voorstel voor hulle gebeur. Vliegtuig- en motorongelukke kan verminder word deur voorspellende ontledings van hul meganiese data en verkeer- en weerpatrone. Aanlyn-dating kan verbeter word deur groot data voorspellers te hê van wie versoenbare persoonlikhede vir jou is. Musikante kan insig kry in watter musieksamestelling die aangenaamste is vir die veranderende smaak van teikengehore. Voedingkundiges kan dalk voorspel watter kombinasie van winkel-gekoopte kosse 'n persoon se mediese toestande sal vererger of help. Die oppervlak is net gekrap en ontdekkings in groot data vind elke week plaas.

Groot data is messig

Monty Rakusen / Getty

Groot data is voorspellende analise: die omskakeling van massiewe ongestruktureerde data na iets soekbaar en sorteerbaar. Dit is 'n morsige en chaotiese ruimte wat 'n spesiale soort kennis en geduld vereis.

Neem byvoorbeeld die monolitiese UPS afleweringsdiens. Die programmeerders by UPS studeer data van hul bestuurders se GPS en slimfone om die mees doeltreffende maniere te analiseer om aan te pas by verkeersopeenhopings. Hierdie GPS- en slimfoondata is reusagtig, en nie outomaties gereed vir analise nie. Hierdie data word ingevoer vanaf verskeie GPS- en kaartdatabasisse, deur middel van verskillende smartphone hardeware toestelle. UPS-ontleders het maande spandeer om al die data te omskep in 'n formaat wat maklik gesoek en gesorteer kan word. Die moeite is egter die moeite werd. Vandag het UPS meer as 8 miljoen liter brandstof bespaar, aangesien hulle hierdie groot data-analise begin gebruik het.

Omdat groot data sleg is en soveel moeite vereis om op te ruim en voor te berei vir gebruik, het data-wetenskaplikes die naam "data-bewakers" genoem vir al die vervelige werk wat hulle doen.

Die wetenskap van groot data en voorspellende analise verbeter egter elke week. Verwag dat groot data maklik toeganklik sal wees vir almal teen die jaar 2025.

Is groot data nie 'n indringende bedreiging vir privaatheid nie?

Feingersh / Getty

Ja, as ons wette en individuele privaatheid verdediging nie versigtig bestuur word nie, word groot data in persoonlike privaatheid ingebring. Soos dit staan, volg Google en YouTube en Facebook al jou daaglikse aanlyn gewoontes . Jou smartphone en rekenaar lewe verlaat elke dag digitale voetspore, en gesofistikeerde maatskappye studeer daardie spore.

Die wette rondom groot data is besig om te ontwikkel. Privaatheid is 'n toestand van wese dat jy nou persoonlike verantwoordelikheid moet neem omdat jy dit nie meer as 'n standaardreg kan verwag nie.

Wat jy kan doen om jou privaatheid te beskerm:

Die grootste stap wat jy kan neem, is om jou daaglikse gewoontes te gebruik deur 'n Skynprivaatnetwerk-netwerkverbinding te gebruik . 'N Skynprivaatnetwerk-diens sal jou sein oorskakel sodat jou identiteit en ligging ten minste gedeeltelik van spoorsnyers gemasker word. Dit sal jou nie 100% anoniem maak nie, maar 'n Skynprivaatnetwerk sal aansienlik verminder hoeveel die wêreld jou aanlyn gewoontes kan waarneem.

Waar kan ek meer weet oor groot data?

Monty Raskusen / Getty

Groot data is 'n fassinerende ding vir mense met analitiese gedagtes en 'n liefde vir tegnologie. As dit jou is, besoek dan hierdie bladsy van interessante groot data projekte.