Што е Data Mining?

Големите компании знаат повеќе за вас отколку што некогаш можевте да замислам - еве како

Податочно рударство е анализа на големи количини на податоци за откривање на модели и знаење. Всушност, податоци за рударство е исто така познат како откривање на податоци или откривање на знаења.

Податоците за рударство користат статистички податоци, принципи на машинско учење (ML), вештачка интелигенција (AI) и огромни количини на податоци (често од бази на податоци или множества на податоци) за да се идентификуваат моделите на начин што е автоматски и корисно како е можно.

Што работи со рударството?

Податоците за рударство имаат две основни цели: опис и предвидување. Прво, податоци за рударство ги опишува увидите и знаењата добиени од анализата на обрасците во податоците. Второ, податоци за рударство ги користи описите на препознатливи модели на податоци за да ги предвидат идните модели.

На пример, ако сте поминале време на интернет страница за купување за книги за тоа како да ги идентификувате различните видови на растенија, услугите за рударство кои работат зад сцената на таа веб-страница се најавуваат опис на вашите пребарувања во врска со вашиот профил. Кога повторно се пријавувате две недели подоцна, службите за рударство на веб-сајтот ги користат описите на вашите претходни пребарувања за да ги предвидат вашите тековни интереси и да понудат персонализирани препораки за купување кои вклучуваат книги за идентификација на растенијата.

Како функционира податоци за рударство

Податочно рударство работи со користење на алгоритми, множества на инструкции кои раскажуваат на компјутер или процесираат како да направат некоја задача, да откријат различни типови на обрасци во рамките на податоците. Некои од различните методи за препознавање на модели кои се користат во рударството на податоци вклучуваат анализа на кластери, откривање на аномалија, учење во асоцијација, зависности од податоци, дрва за одлучување, модели за регресија, класификации, откривање прекумерно и нервните мрежи.

Додека податоци за рударство може да се користи за да се опишат и да се предвидат модели во сите различни видови на податоци, употребата на многу луѓе најчесто се среќаваат, дури и ако тие не го сфаќаат тоа, е да опишат шеми во вашите купувачки избори и однесувања за да се предвиди веројатно идни купувања одлуки.

Како пример, дали некогаш сте се запрашале како Фејсбук секогаш знае да знае што сте пребарувале на интернет и да прикажувате реклами во вашиот newsfeed поврзани со други сајтови што сте ги посетиле или вашите веб-пребарувања? Фејсбук податоци за рударство користи информации зачувани во вашиот прелистувач кој ги следи вашите активности, како што се колачиња , заедно со сопственото знаење за вашите модели врз основа на вашата претходна употреба на услугата на Фејсбук за да откриете и да ги предвидите производите или понудите за кои можеби сте заинтересирани.

Каква вид на податоци може да се минимизира?

Во зависност од услугата или продавницата (физичките продавници користат и рударство на податоци), изненадувачки износ на податоци за вас и вашите модели може да се минимизира. Податоците што се собираат за вас може да вклучат каков тип на возило што го возите, каде живеете, места на кои патувате, списанија и весници на кои се претплатите, и дали сте или не сте во брак. Исто така, може да одлучи дали имате деца или не, кои се твоите хоби, кои ги сакате, вашите политички наклонетости, она што го купувате преку интернет, она што го купувате во физички продавници (често преку картички за наградата за лојалноста на клиентите) и какви било детали што ги делиш за вашиот живот на социјалните медиуми.

На пример, трговците со мало и модните публикации насочени кон тинејџерите користат увид од податоците за рударски фотографии на услугите на социјалните медиуми како Instagram и Facebook за да ги предвидат модните трендови кои ќе ги намамат тинејџерските купувачи или читатели. Увидите откриени преку податоци за рударство може да бидат толку прецизни што некои продавачи на мало дури и може да предвидат дали жената може да биде бремена, врз основа на многу конкретни промени во нејзиниот избор за купување. Малолетникот, Target, е пријавен да биде толку точен со предвидување на бременоста врз основа на шаблони за купување историја, дека испратил купони за бебешки производи на една млада дама, давајќи ја нејзината тајна за бременост пред да ѝ раскаже на нејзиното семејство.

Податоците за рударство секаде, сепак, голем дел од информациите откриени и анализирани за нашите навики за купување, лични преференции, избори, финансии и онлајн активности ги користат продавници и услуги со намера да се подобри искуството на клиентите.