Дефиниција на алгоритмот на Твитер

Како компјутерите на Твитер ги читаат Tweets

Дефиниција:

На паметни луѓе на Твитер се стави заедно супер софистициран алгоритам, така што нивните паметни компјутери знаат како да ги "прочитаат" газиолонските твитови што ги туркаат низ firehose.

Алгоритам, кој било алгоритам, се користи за обработка на податоци, честопати ставајќи ги во кофи кои ќе дадат конечен заклучок. На пример, кога барате нешто во Google или Bing, резултатите од пребарувањето кои ви се враќаат доаѓаат од алгоритам.

Алгоритмот на пребарувачот утврди дека она што го сакате, врз основа на вашето пребарување, е она што тие го откриваат за вас.

Алгоритмот на Твитер, кој ги чита и сортира Tweets, им овозможува на Твитер да дознае што се случува насекаде.

На пример, кога починал Мајкл Џексон, неговата смрт го означи првата, а потоа две, а потоа четири, а потоа шест од десетте тренд-теми што попладне. И тоа беше дваесет минути пред локалната радио станица за вести.

На крајот на секоја година, Твитер објавува страница на "Златни твитови", која ги прикажува најстарите прегледи на Tweets од годината. Тоа е податоци што тие никогаш не би можеле да ги анализираат без специфичен алгоритам за броење на тие retweets.

Кога Твитер прв го откри новиот Discover таб, тие пишувале за алгоритмот што го користел за да го изгради:

"Почнуваме да ја промовираме новата верзија на табот Откријте што е уште повеќе персонализирано за вас. Ги подобривме нашите персонализирани алгоритми за да инкорпорираме неколку нови сигнали вклучувајќи ги и сметките што ги следите и кои ги следат. користи за да ги разбере вашите интереси и прикажување приказни кои се релевантни за вас во реално време.

Зад сцената, новото копче Discover се придвижува од технологијата за пребарување во реално време на Трјливберд. Кога корисник tweets, дека Чуруликам е индексиран и станува пребарувач за неколку секунди. Секој Чуруј со линк, исто така, поминува низ некоја дополнителна обработка: ги екстрахираме и прошируваме сите URL адреси достапни во Tweets, а потоа да ја превземеме содржината на тие URL-а преку SpiderDuck, наш придвижувач на URL-то во реално време.

За да ги генерираме приказните кои се базираат на вашиот социјален графикон и за кои сметаме дека се најинтересни за вас, прво го користиме Касоварите, нашата библиотека за обработка на графикони, за да ги идентификуваме вашите врски и да ги рангираме според тоа колку силни и важни тие врски се за вас.

Откако ја имаме таа мрежа, ние користиме флексибилен пребарувач на Твитер за да најдеме URL адреси што ги споделува тој круг на луѓе. Овие врски се претвораат во приказни што ќе ги прикажеме, заедно со други приказни, во табот Откријте. Пред да ги прикаже, конечната ранг-листа ќе ги преиспита приказите според колку луѓе имаат твитови за нив и колку се важни тие луѓе во врска со вас. Сето ова се случува во блиска реално време, што значи дека кршењето и релевантните приказни се појавуваат во новиот табулатор Discover, веднаш штом луѓето ќе почнат да зборуваат за нив. "

Повеќето бизниси со алгоритми обработуваат тони податоци секој ден. Алгоритмите се ажурираат често по потреба. На пример, во изминатите неколку години, Google го ажурираше нивниот алгоритам за пребарување (на страв од оптимизација насекаде) еден тон пати. Она што го добивате како резултат од пребарувањето денес за било кое дадено пребарување е многу малку веројатно до она што го нашол пред неколку години.

Алгоритмите за пребарување на Твитер станаа неверојатно динамични. Можете да најдете луѓе кои конкретно поставуваат прашање, кои користат смајлирачко лице во нивната Чуруликам, и луѓе кои се Tweeting специјално во вашата географска локација.

Алгоритмот на Твитер не треба да биде толку агресивен како Google, но сигурно е робустен и ефикасно се користи за креирање на нови начини за прегледување на постојните податоци на Твитер.

Заеднички грешки:

Твитер алгоритам
алгоритам