Дефинирање на статистичкиот модел на регресија

Регресијата ги анализира односите меѓу променливите

Регресија е техника за рударство на податоци што се користи за да се предвиди бројни нумерички вредности (исто така наречени континуирани вредности ), со оглед на посебен набор на податоци. На пример, регресија може да се искористи за да се предвиди цената на производот или услугата, со оглед на други променливи.

Регресијата се користи во повеќе индустрии за бизнис и маркетинг планирање, финансиски предвидувања, моделирање на животната средина и анализа на трендовите.

Регресија Vs. Класификација

Регресијата и класификацијата се податоци за рударски техники кои се користат за решавање слични проблеми, но тие често се збунети. Двете се користат во анализата за предвидување, но регресијата се користи за да се предвиди нумеричка или континуирана вредност, додека класификацијата доделува податоци во дискретни категории.

На пример, регресијата би се користела за да се предвиди вредноста на домот врз основа на нејзината локација, квадратни стапки, цена за последно продавање, цената на слични домови и други фактори. Класификацијата би била во ред, ако сакавте да ги организирате куќите во категории, како што се пространоста, големината на лота или стапките на криминал.

Видови регресивни техники

Наједноставната и најстарата форма на регресија е линеарна регресија што се користи за проценка на односот помеѓу две варијабли. Оваа техника ја користи математичката формула на права линија (y = mx + b). Во обичен термин, ова едноставно значи дека, со оглед на графикон со Y и X-оска, односот помеѓу X и Y е права линија со неколку издвојувања. На пример, може да претпоставиме дека, со оглед на порастот на населението, производството на храна ќе се зголеми со иста стапка - ова бара силна, линеарна врска меѓу двете фигури. За да се визуелизира ова, разгледајте графикон во кој Y-оската ги следи населението, а X-оската го следи производството на храна. Со зголемувањето на Y вредноста, вредноста X ќе се зголеми со иста стапка, со што односот помеѓу нив ќе биде права линија.

Напредните техники, како што се повеќекратната регресија, предвидуваат врска помеѓу повеќе променливи - на пример, дали постои корелација помеѓу приходите, образованието и каде што некој ќе избере да живее? Додавањето на повеќе променливи значително ја зголемува комплексноста на предвидување. Постојат неколку типови на повеќекратни регресивни техники, вклучувајќи стандардни, хиерархиски, мешавини и постепено, секој со сопствена апликација.

Во овој момент, важно е да се разбере она што се обидуваме да го предвидиме (зависна или предвидена променлива) и податоците што ги користиме за да го направиме предвидувањето (независни или променливи променливи). Во нашиот пример, ние сакаме да ја предвидиме локацијата каде што еден ќе избере да живее ( предвидена променлива) со оглед на приходите и образованието (двете променливи на предиктори ).