Ռեգրեսիան վերլուծում է հարաբերությունները միջեւ փոփոխականների միջեւ
Ռեգրեսիան այն տվյալների հանքարդյունաբերության տեխնիկան է, որն օգտագործվում է կանխատեսելու մի շարք թվային արժեքների (նաեւ կոչվում է շարունակական արժեքներ ) որոշակի տվյալների բազա: Օրինակ, ռեգրեսիան կարող է օգտագործվել ապրանքի կամ ծառայության արժեքը կանխատեսելու համար, հաշվի առնելով այլ փոփոխականներ:
Ռեպրեսիան օգտագործվում է տարբեր ոլորտներում բիզնեսի եւ մարկետինգի պլանավորման, ֆինանսական կանխատեսումների, բնապահպանական մոդելավորման եւ միտումների վերլուծության համար:
Ռեժիմը Vs. Դասակարգում
Ռեգրեսիան եւ դասակարգումը նմանատիպ խնդիրներ լուծելու համար օգտագործվող տվյալների հանքարդյունաբերության տեխնիկան են, բայց դրանք հաճախ շփոթված են: Երկուսն էլ օգտագործվում են կանխատեսման վերլուծության մեջ, սակայն ռեգրեսիան օգտագործվում է կանխատեսելու համարակալված կամ շարունակական արժեք, մինչդեռ դասակարգումը տվյալներ է տալիս առանձին կատեգորիաներ:
Օրինակ, ռեգրեսիան օգտագործվելու է տան արժեքը կանխատեսելու համար `հիմնված իր գտնվելու վայրի, քառակուսի ոտքերի, գինը, երբ վերջին վաճառվել է, նմանատիպ տների գինը եւ այլ գործոններ: Դասակարգումը կկիրառվի, եթե ցանկանում եք փոխել տներ ձեր կատեգորիաներում, ինչպիսիք են walkability, lot size կամ հանցագործության դրույքաչափերը:
Ռեգրեսիայի մեթոդների տեսակները
Ռեժիմի ամենապարզ եւ ամենահին ձեւը գծային ռեգրեսիան է, որն օգտագործվում է երկու փոփոխականների միջեւ հարաբերությունները գնահատելու համար: Այս մեթոդը օգտագործում է ուղիղ գծի մաթեմատիկական բանաձեւը (y = mx + b): Պարզապես, սա պարզապես նշանակում է, որ հաշվի առնելով Y- ի եւ X- առանցքի գրաֆիկը, X- ի եւ Y- ի միջեւ հարաբերությունները ուղիղ գիծ են մի քանի արտածում: Օրինակ, կարելի է ենթադրել, որ բնակչության աճը հաշվի առնելով, սննդի արտադրությունը կաճի նույն չափով, ինչը պահանջում է ուժեղ, գծային հարաբերություններ երկու գործիչների միջեւ: Այն պատկերացնելու համար դիտեք մի գրաֆիկ, որտեղ Y- առանցքի հետքերը աճում են, եւ X- առանցքը հետեւում է սննդի արտադրությանը: Քանի որ Y արժեքը մեծանում է, X արժեքը կբարձրանա նույն չափով, ինչը նրանց միջեւ ուղիղ գիծ է դարձնում:
Ընդլայնված մեթոդներ, ինչպիսիք են բազմակի ռեգրեսիան, կանխատեսում են բազմաթիվ փոփոխականների միջեւ փոխհարաբերությունները, օրինակ, գոյություն ունի եկամուտների, կրթության եւ որտեղից է ընտրում ապրելը: Ավելի փոփոխականների ավելացումը զգալիորեն մեծացնում է կանխատեսման բարդությունը: Կան բազմատեսակ ռեգրեսիոն տեխնիկայի մի քանի տեսակներ, ներառյալ ստանդարտ, հիերարխիկ, setwise եւ աստիճանաբար, յուրաքանչյուրը իր սեփական կիրառմամբ:
Այս պահին կարեւոր է հասկանալ, թե ինչ ենք փորձում կանխատեսել (կախված կամ կանխատեսված փոփոխական) եւ այն տվյալները, որոնք մենք օգտագործում ենք, կանխատեսումը դարձնելու համար (անկախ կամ կանխատեսող փոփոխականները): Մեր օրինակում մենք ուզում ենք կանխատեսել այն վայրը, որտեղ ընտրում է ապրել ( կանխատեսված փոփոխական) տրված եկամուտը եւ կրթությունը (երկուսն էլ կանխատեսող փոփոխականները):
- Ստանդարտ բազմակի ռեգրեսիան միեւնույն ժամանակ դիտում է բոլոր կանխատեսող փոփոխականները: Օրինակ `1) եկամուտների եւ կրթության միջեւ հարաբերությունները (կանխատեսողներ) եւ հարեւանության ընտրությունը (կանխատեսված); եւ 2) առանձին կանխատեսողներից յուրաքանչյուրը ինչ կապ ունի այդ հարաբերություններին:
- Քայլային բազմակի ռեգրեսիան ամբողջովին տարբեր հարց է տալիս: Քայլային ռեգրեսիոն ալգորիթմը վերլուծում է, թե որ կանխորոշիչները լավագույնս օգտագործվում են կանխատեսելու հարեւանության ընտրությունը `նշանակում է, որ փուլային մոդելը գնահատում է կանխատեսող փոփոխականների կարեւորության կարգը եւ ապա ընտրում է համապատասխան ենթաբազմություն: Ռեգրեսիոն այս խնդրի այս տեսակը օգտագործում է «քայլեր», ռեգրեսիոն հավասարման մշակման համար: Հաշվի առնելով այս տեսակի ռեգրեսիան, բոլոր կանխատեսողները չեն կարող նույնիսկ հայտնվել ռեգրեսիոն հավասարման մեջ:
- Հիերարխիկ ռեգրեսիան , ինչպես աստիճանական, այնպես էլ հաջորդական գործընթաց է, սակայն կանխորոշիչի փոփոխականները մուտքագրվում են նախօրոք սահմանված նախօրոք սահմանված կարգով, այսինքն, ալգորիթմը չի պարունակում հավասարումների շարք, որը սահմանում է կարգը, մուտքագրեք կանխատեսողներին: Սա առավել հաճախ օգտագործվում է այն դեպքում, երբ ռեգրեսիոն հավասարման ստեղծող անհատը դաշտի վերաբերյալ գիտելիք ունի:
- Setwise ռեգրեսիան նույնպես նման է փուլային, բայց վերլուծում է փոփոխականների սահմանները, այլ ոչ թե անհատական փոփոխականների: