Што точно е "големи податоци"?

И зошто е тоа голема работа?

"Големи податоци" е новата наука за разбирање и предвидување на човечкото однесување со проучување на големи количини на неструктурирани податоци. Големи податоци се познати и како "предиктивна анализа".

Анализа на Твитер мислења, Фејсбук гасови, eBay пребарувања, ГПС trackers, и АТМ машини се некои големи податоци примери. Проучувањето на безбедносни видеа, податоци за сообраќај, временски обрасци, пристигнувања на летови, дневници на мобилни телефони и треператорите на срцето се други форми. Големите податоци претставуваат нередна нова наука која се менува неделно, а само неколку експерти разбираат сето тоа.

Кои се некои примери на големи податоци во редовниот живот?

screenshot http://project.wnyc.org/transit-time

Додека повеќето големи проекти за податоци се многу нејасни, постојат успешни примери на големи податоци кои влијаат на секојдневниот живот на поединци, компании и влади:

Предвидување на епидемии на вирусот: со проучување на социо-политички податоци, временски и климатски податоци и болнички / клинички податоци, овие научници сега предвидуваат појава на епидемии на денга треска со предупредување од 4 недели однапред.

Homicide Watch: овој голем профил на проектните профили ги убива жртвите, осомничените и криминалците во Вашингтон. И како начин за почитување на починатиот и како ресурс за информирање за луѓето, овој голем проект за податоци е фасцинантен.

Транзит Патување планирање, Њујорк: WNYC радио програмер Стив Melendez комбинираат распоредот на метрото со софтвер за патување. Неговото создавање им овозможува на Њујорчани да кликнат на нивната локација на мапата, и ќе се појави предвидување на времето за патување за возови и метро.

Xerox ја намали својата загуба на работна сила: работата на телефонскиот центар е емотивно исцрпувачка. Xerox ги проучуваше податоците на податоците со помош на професионални аналитичари, а сега тие можат да предвидат кој центар за повици најверојатно ќе остане со компанијата најдолго.

Поддршка на борбата против тероризмот: со проучување на социјалните медиуми, финансиските евиденции, резервациите за летови и безбедносните податоци, спроведувањето на законот може да ги предвиди и да ги лоцира осомничените лица пред да ги извршат своите злобни дела.

Прилагодување на маркетингот базиран на коментарите на социјалните медиуми : луѓето отворено и брзо ги споделуваат своите онлајн мисли во паб, ресторан или фитнес клуб. Можно е да се проучат овие милиони мислења во социјалните медиуми и да се дадат повратни информации до компанијата за тоа што луѓето мислат за нивните услуги.

Кој користи големи податоци? Што прават со тоа?

Многу монолитни корпорации користат големи податоци за да ги прилагодат своите понуди и цени за да го зголемат задоволството на клиентите.

Зошто големите податоци се толку важни?

4 нешта значат големи податоци:

1. Податоците се масивни. Тоа нема да се вклопи во еден хард диск , а уште помалку USB стик . Обемот на податоци далеку го надминува она што човечкиот ум може да го почувствува (мислам на една милијарда милијарди мегабајти, а потоа се множи со повеќе милијарди).

2. Податоците се неуредни и неструктурирани. 50% до 80% од големите податоци за работа е конвертирање и чистење на информации, така што може да се пребарува и сортира. Само неколку илјади експерти на нашата планета целосно знаат како да го направат ова расчистување на податоците. Овие експерти, исто така, треба многу специјализирани алатки, како HPE и Hadoop, да го направат својот занает. Можеби по 10 години, експертите за големи податоци ќе станат пара од десетина, но за сега тие се многу редок вид на аналитичар и нивната работа сеуште е многу нејасна и досадна.

3. Податоците станаа стока ** која може да се продаде и купи. Постојат пазари на податоци каде компаниите и поединците можат да купат терабајти од социјалните медиуми и други податоци. Поголемиот дел од податоците се базираат на облак, бидејќи е преголем за да се вклопат на еден хард диск. Купувањето на податоци вообичаено вклучува претплата каде што се поврзете во фарма на облак сервер.

** Лидерите на големи алатки и идеи за податоци се Амазон, Гугл, Фејсбук и Јаху. Бидејќи овие компании служат толку многу милиони луѓе со своите онлајн услуги, има смисла дека тие ќе бидат точка на собирање и визионери зад големата анализа на податоци.

4. Можностите за големи податоци се бесконечни. Можеби лекарите еден ден ќе предвидат срцев удар и потези за лицата неколку недели пред да се случат. Авионски и автомобилски несреќи може да се намалат со предвидливи анализи на нивните механички податоци и сообраќајни и временски обрасци. Онлајн датира може да се подобри со тоа што имаат големи податоци предиктори за кои се компатибилни личности за вас. Музичарите може да добијат увид во тоа што музичкиот состав е најудобен за променливите вкусови на целната публика. Нутриционистите можеби ќе бидат во можност да предвидат која комбинација на купени храна ќе ги влоши или ќе помогне во медицинските состојби на лицето. Површината е само изгребана, а откритија во големи податоци се случуваат секоја недела.

Големи податоци се неуредни

Монти Ракусен / Гети

Големи податоци се предвидливи аналитики: конвертирање на масивни неструктурирани податоци во нешто што може да се пребарува и сортира. Ова е неуреден и хаотичен простор кој бара посебен вид на знаење и трпеливост.

Земете го на пример монолитот за испорака на UPS-от. Програмерите во UPS-от студираат податоци од GPS-уредите на нивните возачи и паметни телефони за да ги анализираат најефикасните начини за прилагодување кон сообраќајниот метеж. Овие GPS и податоци за паметни телефони се огромни, а не автоматски подготвени за анализа. Овие податоци се истураат од разни бази на податоци за GPS и мапи, преку различни хардверски уреди на паметни телефони. Аналитичарите на UPS-и имаат поминато месеци конвертирање на сите тие податоци во формат кој лесно може да се пребарува и сортира. Сепак, напорите вредеа. Денес, UPS-от има зачувано повеќе од 8 милиони литри гориво, бидејќи тие почнаа да ја користат оваа голема анализа на податоци.

Бидејќи големите податоци се неуредни и бараат многу напор за расчистување и подготовка за употреба, научниците за податоци станаа прекари на "податоци janitors" за сите мачна работа што ја прават. -

Сепак, науката за големи податоци и предвидлива анализатор се подобрува секоја недела. Очекувајте големи податоци да бидат достапни за секого до 2025 година.

Зарем големи податоци не се закана за приватноста?

Feingersh / Getty

Да, ако нашите закони и поединечни одбрани за заштита на приватноста не се внимателно управувани, тогаш големите податоци навлегуваат во лична приватност. Како што стои, Google, YouTube и Фејсбук веќе ги следат вашите дневни онлајн навики . Вашиот паметен телефон и компјутерскиот живот оставаат дигитални стапалки секој ден, а софистицираните компании ги проучуваат овие стапалки.

Законите околу големите податоци се развиваат. Приватноста е состојба на постоење на која сега мора да преземете лична одговорност, бидејќи повеќе не можете да го очекувате како стандардно право.

Што можете да направите за да ја заштитите вашата приватност:

Најголемиот единствен чекор што може да го направите е да ги скриете вашите секојдневни навики користејќи VPN мрежна врска . Услугата VPN ќе го помести вашиот сигнал, така што вашиот идентитет и локација ќе бидат барем делумно маскирани од тракери. Ова нема да ве направи 100% анонимен, но VPN значително ќе го намали колку светот може да ги набљудува вашите онлајн навики.

Каде можам да дознаам повеќе за големите податоци?

Монти Раскрусен / Гети

Големи податоци е фасцинантна работа за луѓе со аналитички умови и љубов кон технологијата. Ако тоа сте вие, тогаш дефинитивно ја посетите оваа страница со интересни големи проекти за податоци.