Ռեժիմի վիճակագրական մոդելի սահմանումը

Ռեգրեսիան վերլուծում է հարաբերությունները միջեւ փոփոխականների միջեւ

Ռեգրեսիան այն տվյալների հանքարդյունաբերության տեխնիկան է, որն օգտագործվում է կանխատեսելու մի շարք թվային արժեքների (նաեւ կոչվում է շարունակական արժեքներ ) որոշակի տվյալների բազա: Օրինակ, ռեգրեսիան կարող է օգտագործվել ապրանքի կամ ծառայության արժեքը կանխատեսելու համար, հաշվի առնելով այլ փոփոխականներ:

Ռեպրեսիան օգտագործվում է տարբեր ոլորտներում բիզնեսի եւ մարկետինգի պլանավորման, ֆինանսական կանխատեսումների, բնապահպանական մոդելավորման եւ միտումների վերլուծության համար:

Ռեժիմը Vs. Դասակարգում

Ռեգրեսիան եւ դասակարգումը նմանատիպ խնդիրներ լուծելու համար օգտագործվող տվյալների հանքարդյունաբերության տեխնիկան են, բայց դրանք հաճախ շփոթված են: Երկուսն էլ օգտագործվում են կանխատեսման վերլուծության մեջ, սակայն ռեգրեսիան օգտագործվում է կանխատեսելու համարակալված կամ շարունակական արժեք, մինչդեռ դասակարգումը տվյալներ է տալիս առանձին կատեգորիաներ:

Օրինակ, ռեգրեսիան օգտագործվելու է տան արժեքը կանխատեսելու համար `հիմնված իր գտնվելու վայրի, քառակուսի ոտքերի, գինը, երբ վերջին վաճառվել է, նմանատիպ տների գինը եւ այլ գործոններ: Դասակարգումը կկիրառվի, եթե ցանկանում եք փոխել տներ ձեր կատեգորիաներում, ինչպիսիք են walkability, lot size կամ հանցագործության դրույքաչափերը:

Ռեգրեսիայի մեթոդների տեսակները

Ռեժիմի ամենապարզ եւ ամենահին ձեւը գծային ռեգրեսիան է, որն օգտագործվում է երկու փոփոխականների միջեւ հարաբերությունները գնահատելու համար: Այս մեթոդը օգտագործում է ուղիղ գծի մաթեմատիկական բանաձեւը (y = mx + b): Պարզապես, սա պարզապես նշանակում է, որ հաշվի առնելով Y- ի եւ X- առանցքի գրաֆիկը, X- ի եւ Y- ի միջեւ հարաբերությունները ուղիղ գիծ են մի քանի արտածում: Օրինակ, կարելի է ենթադրել, որ բնակչության աճը հաշվի առնելով, սննդի արտադրությունը կաճի նույն չափով, ինչը պահանջում է ուժեղ, գծային հարաբերություններ երկու գործիչների միջեւ: Այն պատկերացնելու համար դիտեք մի գրաֆիկ, որտեղ Y- առանցքի հետքերը աճում են, եւ X- առանցքը հետեւում է սննդի արտադրությանը: Քանի որ Y արժեքը մեծանում է, X արժեքը կբարձրանա նույն չափով, ինչը նրանց միջեւ ուղիղ գիծ է դարձնում:

Ընդլայնված մեթոդներ, ինչպիսիք են բազմակի ռեգրեսիան, կանխատեսում են բազմաթիվ փոփոխականների միջեւ փոխհարաբերությունները, օրինակ, գոյություն ունի եկամուտների, կրթության եւ որտեղից է ընտրում ապրելը: Ավելի փոփոխականների ավելացումը զգալիորեն մեծացնում է կանխատեսման բարդությունը: Կան բազմատեսակ ռեգրեսիոն տեխնիկայի մի քանի տեսակներ, ներառյալ ստանդարտ, հիերարխիկ, setwise եւ աստիճանաբար, յուրաքանչյուրը իր սեփական կիրառմամբ:

Այս պահին կարեւոր է հասկանալ, թե ինչ ենք փորձում կանխատեսել (կախված կամ կանխատեսված փոփոխական) եւ այն տվյալները, որոնք մենք օգտագործում ենք, կանխատեսումը դարձնելու համար (անկախ կամ կանխատեսող փոփոխականները): Մեր օրինակում մենք ուզում ենք կանխատեսել այն վայրը, որտեղ ընտրում է ապրել ( կանխատեսված փոփոխական) տրված եկամուտը եւ կրթությունը (երկուսն էլ կանխատեսող փոփոխականները):