Štatistici použiť techniku lineárnej regresie nájsť priamku , ktorá najlepšie zodpovedá sérii x a y dátových párov . Robia to prostredníctvom série výpočtov , ktoré sú odvodené rovnice najlepšie linky . Tento matematický opis trati bude lineárna rovnica a majú všeobecný tvar y = mx + b , kde x a y sú dve premenné v dátovej pary , m je sklon priamky a a b je jej úsek .
Korelačný koeficient
Výpočty , ktoré nájdete najlepšie priamku bude produkovať lineárnej rovnici , aby sa zmestili každý súbor dát , a to aj v prípade , že dáta nie sú v skutočnosti veľmi lineárny . Ak chcete mať predstavu o tom, ako dobre sú údaje skutočne vojde priamku , štatistici tiež vypočítať číslo známe ako korelačného koeficientu . Táto skutočnosť je daná symbol R alebo R a je meradlom toho, ako úzko späté dátové pary sú najlepšie priamke po nich .
Význam výskumu
R môže mať ľubovoľnú hodnotu medzi -1 a 1. záporná hodnota R jednoducho znamená , že najvhodnejšie priamka má sklon smerom dolu pohybujúce sa zľava doprava , skôr než smerom nahor . Bližšie R je buď z oboch extrémov , lepšie hodí dátových bodov na líniu , a to buď s , alebo -1 1 je perfektný a R hodnota nula znamená , že nie je vhodné a body sú úplne náhodné . Ak sú dátové body sú dobre zladené s priamkou , je tam vraj nejaký vzťah medzi nimi , preto meno korelačný koeficient R.
R2
Niektoré štatistici prednosť práci s hodnotou R2 , ktorý je potom korelačný koeficient na druhú , alebo násobí sama o sebe , a je známy ako koeficient určenia . R2 je veľmi podobný R a tiež popisuje vzájomný vzťah medzi dvoma premennými , ale to je tiež trochu líši . Meria percento variability v y premenné, ktoré možno pripísať na kolísanie v premennej x . Hodnota R 2 0,9 , napríklad znamená , že 90 percent je zmena v y údajov je vzhľadom k rozdielom v x dát . To nemusí nutne znamenať , že x je skutočne ovplyvňuje y , ale zdá sa , že robí tak .