Genel Basit Doğrusal Regresyon BASİT DOĞRUSAL REGRESYONİşlenecek olan konunun ard ndan Saç l m grafiğinin ne olduğu; • İki değişken aras ndaki ilişkinin • hesaplanmas ve yorumu. Hesaplanan ilişkinin anlaml olup • olmad ğ na karar verilmesi. Bir veri setinde basit doğrusal regresyon • katsay lar n n hesaplanmas ve yorumu. Regresyon analizi uygulamak için gerekli • varsay mlar n ne olduğu? Kurulan regresyon modelin anlaml l ğ . •A Saç l m grafiği iki değişken aras ndaki • ilişkiyi grafik olarak gösteren yard mc bir araçt r. X-y grafiği olarak da adland r l r. Saç l m Grafiğiİki değişken aras ndaki ilişki X Y (a) Do rusalİki değişken aras ndaki ilişki X Y (b) Do rusalİki değişken aras ndaki ilişki (c) E risel X Yİki değişken aras ndaki ilişki (d) li ki yok X YSaç l m grafiği ( x-y grafiği) ile, iki değişken seti aras ndaki ilişkinin doğrusal olup olmad ğ ve ilişkinin yönü hakk nda genel bir perspektif edinilir. Bununla birlikte ilişkinin yap s ve yönü hakk nda daha tutarl ve hassas ölçülere ihtiyaç duyulur. Korelasyon katsay s , iki değişken aras ndaki ilişkiyi matematiksel olarak ölçen bir istatistiktir. İLİŞKİ TİPLERİ Değişkenlerin tipi ve dağ l mlar na göre farkl yollarla korelasyon katsay s hesaplan r. Pearson's r: Her iki değişkenin (metrik kesikli ve/veya sürekli) Normal dağ l m veya Normal dağ l m özelliği gösterdiği durumlarda Pearson’s r korelasyon katsay s kullan l r. Spearman's rho: Her iki değişkenin metrik • olmad ğ s ral ölçülerde veya Normal dağ l m özelliği göstermediği durumlarda s ralamaya dayal hesaplanan korelasyon değeridir. Pearson’s Korelasyon Katsay s ( r) Matematiksel gösterimi • 2222 ()() n x y x y r n x x n y y ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?Spearman's Korelasyon Katsay s (r s ) Spearman's rho (r s ): Veri seti s raland ktan sonra aşağ daki formül ile korelasyon hesaplan r d= iki değişken aras ndaki fark belirtir ) 1 n ( n d 6 1 r 2 2 s ? ? ? ? ? ?The Correlation Coefficient Korelasyon katsay s ( r ), x ve y değişkenleri • aras ndaki ilişkinin derecesini aç klar. Korelasyon katsay s n n ( r ) işareti, ilişkinin • yönünün belirler. Korelasyon katsay s ( r ) between –1 ve +1 • aras ndaki herhangi bir değer alabilir. Korelasyon katsay s n n işareti ( r ) her zaman • regresyon katsay s ( b )’n n işareti ile ayn d r. Korelasyon katsay s n n ald ğ değeri yorumlamak için: r her zaman -1 +1 aral ğ ndad r. Bu değer her iki • yana çok yak n ise, saç l m grafiğinde noktalar aras bozulma o derece küçüktür. Bu nedenle iki değişken aras nda güçlü bir ilişki sözkonusudur. r -1 veya +1 değerlerine eşitse iki değişken • aras nda mükemmel bir ilişki vard r. Saç l m grafiğinde tüm noktalar doğru üzerinde gözükecektir. (bu doğru regresyon doğrusu olarak bilinir). Eğer r 0’a çok yak n bir değer alm şsa, the bozulma oldukça büyük görünecek ve değişkenler birbiri ile ilişki göstermeyeceklerdir. Korelasyon katsay s ndaki ( r ) pozitif veya negatif işaret iki değişken aras nda pozitif veya negatif ilişkinin varl ğ na işaret eder.KORELASYON KATSAYISININ GÜCÜ r = -1: Mükemmel negatif bir ilişki ( x yukar ç karken, y aşağ doğru) r = +1: Mükemmel pozitif bir ilişki ( x yukar ç karken, y yukar ç kar) r = 0: x ve y aras nda bir ilişki görülmemektedir Bu değerlerin d ş nda bir katsay hesapland ğ nda genel olarak korelasyon katsay s ( r ) için: 0.0 ile 0.2 Çok zay f veya ihmal edilebilir bir ilişki 0.2 ile 0.4 Zay f, düşük ilişki 0.4 ile 0.7 orta derecede ilişki 0.7 ile 0.9 Güçlü, yüksek ilişki 0.9 ile 1.0 Çok yüksek ilişkiSaç l m Grafiği r= -1 r= 0 r= +1 Mükemmel İlişki yok Mükemmel negatif pozitifNo Hamile Hafta (x) Hemo. (y) x 2 y 2 xy 1 33 10.8 1089 116.6 356.4 2 33 9.5 1089 90.3 313.5 3 23 14.2 529 201.6 326.6 4 34 9.7 1156 94.1 329.8 . . . . . . . . . . . . 17 27 12.8 729 163.8 345.6 18 29 11.0 841 121.0 319.0 19 24 13.5 576 182.3 324.0 20 31 10.8 961 116.6 334.8 Top. 581 236.6 17215 2842.4 6761.6 Örnek: Hemoglobin verilerini kullanarak Pearson’s ve Spearman’s korelasyon katsay lar n hesaplay p, yorumlay n z .Hemoglobin 9 10 11 12 13 14 15 20 22 24 26 28 30 32 34 36 Gestation WeekPearson’s Korelasyon Katsay s Hemoglobin düzeyi ile hamilelik (hafta) aras nda negatif güçlü bir ilişki vard r. (Pearson’s r= -0.922) 2222 ()() n x y x y r n x x n y y ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 922 . 0 ) ) 6 . 236 ( 4 . 2842 * 20 ( ) ) 581 ( 17215 * 20 ( 6 . 236 * 581 6 . 6761 * 20 r 2 2 ? ? ? ? ? ?Correlations 1 -,922** ,000 20 20 -,922** 1 ,000 20 20 Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N HEMO GESTWEEK HEMO GESTWEEK Correlation is significant at the 0.01 level (2-tailed). **. PEARSON’S KORELASYON KATSAYISININ SPSS ÇIKTISI Spearman’s Korelasyon Katsay s (r s ) No Hafta Rank 1 Hemo. Rank 2 D= Rank 1 -Rank 2 1 33 16.0 9,5 1.0 15 2 34 18.0 9,7 2.5 15,5 3 35 19.5 9,7 2.5 17 4 33 16.0 10,5 4.0 12 . . . . . . . . . . . . 17 24 4.0 13,5 17.0 -13 18 22 1.0 13,8 18.0 -17 19 25 5.0 14 19.0 -14 20 23 2.5 14,2 20.0 -17,5 R 1 : Hafta s ralamas ; R 2 : hemoglobin düzeyi s ralamasSpearman’s Korelasyon Katsay s (r s ) Hemoglobin düzeyi ile hamilelik (hafta) aras nda negatif güçlü bir ilişki vard r. (Spearman’s rho r s = -0.916). 916 . 0 ) 1 20 ( 20 2548 * 6 1 ) 1 n ( n d 6 1 r 2 2 2 s ? ? ? ? ? ? ? ? ? ? ?SPEARMAN’S KORELASYON KATSAYISININ SPSS ÇIKTISI Correlations 1,000 -,916** ,000 20 20 -,916** 1,000 ,000 20 20 Correlation Coefficient Sig. (2-tailed) N Correlation Coefficient Sig. (2-tailed) N HEMO GESTWEEK Spearman's rho HEMO GESTWEEK Correlation is significant at the 0.01 level (2-tailed). **. Doğrusal regresyon analizi, bağ ml • değişken ile bir veya daha fazla bağ ms z değişken aras nda bir ilişki kurar. Doğrusal model, bağ ml değişkeni • bağ ms z değişkenin ald ğ değerin doğrudan oran olarak gösterir. Basit Doğrusal regresyon analizinde • sadece bir bağ ms z değişken bulunur. BASİT DOĞRUSAL REGRESYON Bağ ml değişken (y); regresyon • modelinde aç klanan veya tahmin edilecek olan değişkendir. Bu değişkenin bağ ms z değişkenle fonksiyonel bir ilişkide olduğu varsay l r. Bağ ms z değişken (x) regresyon • modelinde bağ ml değişken ile ilişkili değişkendir. Bağ ms z değişken, regresyon modelinde bağ ml değişkenin değerini tahmin etmek için kullan l r.BASİT DOĞRUSAL REGRESYON MODELİ (POPULASYON MODELİ) y = ? + x + y= bağ ml değişken x= bağ ms z değişken ?= sabit (y-eksenini kestiği nokta) = regresyon doğrusunun eğimi = hata terimi veya art kRegresyon Parametreleri ? = sabit doğrunun y eksenini kestiği nokta. – Bağ ms z değişkenin değerinin = 0 olduğu – durumda bağ ml değişkenin ald ğ değerdir. = eğim Bağ ms z değişkendeki değişime dayal – olarak bağ ml değişkende görülen değişimdir. Eğimin alacağ katsay n n işareti iki – değişken aras ndaki ilişkiye bağl olarak pozitif veya negatif olabilir.y ˆ = Tahmin edilen y değeri (bağ ml değişken) a = regresyon sabit değerinin yans z tahmini b = regresyon eğiminin yans z tahmini x = bağ ms z değişken değeri bx a y ˆ ? ? TAHMİN EDİLEN REGRESYON MODELİ (ÖRNEKLEM MODELİ)Basit doğrusal regresyon modelin baz varsay mlar bulunmaktad r: ? I hata terimlerinin her biri istatistiksel • olarak bir diğerinden bağ ms zd r. ? hata terimlerinin ald ğ değerler normal • dağ l m özelliği göstermelidir. Hata varyans sabittir ve veriler aras nda • hiç değişmediği varsay l r. Buna otokorelasyon veya serisel korelasyon bulunmamas varsay m ad verilir. Bağ ms z değişken hatas zd r. Eğer • bağ ms z değişkende hata bulunduğu varsay l rsa özel bir yöntem şekli olan değişkenler-içinde-hata modeli teknikler kullan larak model kurulmal d r. = Hata terimi (art k) Regresyon modelleri tam (%100) doğru • tahmin yapma özeliğine sahip değillerdir. Hata terimi (art k), gözlenen değer ile model taraf ndan tahmin edilen değer aras ndaki farkt r. y ˆ y ? ? ?Art k terminin (hata) grafiksel gösterimi X Y 4 300 200 100 400 390 4 * 60 150 x 60 150 y ˆ ? ? ? ? ? 390 312 = Art k = 312 - 390 = -78 Regresyon Parametrelerinin Tahmini b ve a katsay lar aşağ daki eşitlikler kullan larak hesaplan r : n x x n y x x y x x y y x x b 2 2 2 ) ( ) ( ) )( ( ? ? ? ? ? ? ? ? ? ? ? ? ? ? x b y a ? ?En küçük kareler (EKK) yöntemi kullan larak modeldeki art k kareler toplam minimize edilerek parametre tahminleri yap l r. Örnek: Hamilelik haftas ile hemoglobin düzeyi aras nda anlaml bir ilişki bulunmakta m d r? Basit doğrusal regresyon modelini oluşturarak eğim parametresinin anlaml l ğ n test ediniz. No Hafta Hemoglobin No Hafta Hemoglobin 1 33 10.8 11 33 10.5 2 33 9.5 12 30 11.0 3 23 14.2 13 35 10.9 4 34 9.7 14 25 14.0 5 32 11.2 15 22 13.8 6 35 9.7 16 28 12.9 7 30 12.1 17 27 12.8 8 23 13.0 18 29 11.0 9 28 12.0 19 24 13.5 10 26 13.2 20 31 10.8No Hafta (x) Hemo. (y) x 2 xy 1 33 10.8 1089 356.4 2 33 9.5 1089 313.5 3 23 14.2 529 326.6 4 34 9.7 1156 329.8 . . . . . . . . . . . . . . . 17 27 12.8 729 345.6 18 29 11.0 841 319.0 19 24 13.5 576 324.0 20 31 10.8 961 334.8 Total 581 236.6 17215 6761.6331 . 0 20 ) 581 ( 17215 20 6 . 236 * 581 6 . 6761 ) ( 2 2 2 ? ? ? ? ? ? ? ? ? ? ? ? ? n x x n y x x y b 4 . 21 20 581 ) 331 . 0 ( 20 6 . 236 ? ? ? ? ? ? x b y a x y 331 . 0 4 . 21 ? ? Regresyon parametrelerinin tahmini Eğim parametresinin (b) anlaml l ğ n n testi t , n-(p+1) = t (0.05, 18) = 2.1, t= 10.1 > t (0.05, 18) = 2.1, red H 0 ; eğim s f r değildir. (n= örneklem genişliği, p= bağ ms z değişken say s ) 033 . 0 S b ? 0 : 0 : 1 0 ? ? ? ? H H 1 . 10 033 . 0 331 . 0 S b t b ? ? ? ? ?ARALIK TAHMİNİ Tahminler çekilen örnekten örneğe değişeceğinden regresyon katsay lar n standart hatalar ile vermek yerinde olacakt r , . Tahminlerin standart hatalar çoğu istatistik paket program n n ç kt lar nda confidence interval (güven aral ğ ) CI olarak gösterilir ve n n içinde bulundu u aral k ile birlikte verilir : (1- )% CI for 95% güven aral ğ nda : (-4.000, -0.263) (t (0.05, 18) = 2.1). b S 033 . 0 * 1 . 2 331 . 0 S t b b ) 1 p ( n , ? ? ? ? ? ?Belirtme katsay s (determinasyon katsay s ) Belirtme katsay s , doğrusal modelin uyum iyiliğinin en iyi ölçüsüdür. Bağ ml değişkendeki değişimin ne kadar n n bağ ms z değişken (ler) taraf ndan aç kland ğ n ifade eder. Bu durum, regresyon modelinin aç klay c l k gücünün iyi bir göstergesidir. ( R 2 ) Örneğimizde, hemoglobin düzeyindeki değişimin %85’nin hamileliğin bulunduğu hafta ile aç klanabileceği hesaplanm şt r. (R 2 = 0.85).Örnek: SPSS ile yaş ile %yağ değişkenleri aras ndaki ilişkiyi Person ve Spearman’s korelasyon katsay lar kullanarak hesaplay n z. Değişkenler aras nda anlaml bir ilişki varsa regresyon modelini oluşturarak modelin anlaml l ğ n test ediniz. No Yaş Rank %Yağ Rank No Yaş Rank %Yağ Rank 1 23 1.5 9.5 2 10 53 10.5 34.7 16 2 23 1.5 27.9 7 11 53 10.5 42.0 18 3 27 3.5 7.8 1 12 54 12.0 29.1 8 4 27 3.5 17.8 3 13 56 13.0 32.5 12 5 29 5.0 31.4 11 14 57 14.0 30.3 9 6 41 6.0 25.9 5 15 58 15.5 33.0 13 7 45 7.0 27.4 6 16 58 15.5 33.8 14 8 49 8.0 25.2 4 17 60 17.0 41.1 17 9 50 9.0 31.1 10 18 61 18.0 34.5 15AGE 70 60 50 40 30 20 F ATPERC 50 40 30 20 10 0 FAT %Correlations 1 749** 000 18 18 749** 1 000 18 18 g ( ) g ( ) AGE FATPERC ant at the 0.01 level (2-tailed). Correlations 1 000 754** 000 18 18 754** 1 000 000 18 18 g ( ) g ( ) p AGE FATPERC ant at the 0.01 level (2-tailed).SPSS ÇIKTISI Coefficients a 5,806 5,258 1,104 ,286 -5,340 16,953 ,498 ,110 ,749 4,518 ,000 ,264 ,732 (Constant) AGE Model 1 B Std. Error Unstandardized Coefficients Beta Standardized Coefficients t Sig. Lower Bound Upper Bound 95% Confidence Interval for B Dependent Variable: FATPERC a. Model Summary ,749 a ,561 ,533 6,2483 Model 1 R R Square Adjusted R Square Std. Error of the Estimate Predictors: (Constant), AGE a. ANOVA b 796,878 1 796,878 20,411 ,000 a 624,660 16 39,041 1421,538 17 Regression Residual Total Model 1 Sum of Squares df Mean Square F Sig. Predictors: (Constant), AGE a. Dependent Variable: FATPERC b.