Genel Analitik Kimya İstatistik Verilerin İşlenmesi ve Değerlendirilmesi ( sunu ) ANAL İT İK K İMYA DERS NOTLARI Yrd.Doç.Dr. Hüseyin ÇEL İKKAN 3. BÖLÜM : İSTAT İST İkK VER İLER İN İŞLENMES İ ve DE ĞERLEND İR İLMES İDENEY SONUÇLARININ KAL İ TES İ N İ BEL İ RLEMEK Deneysel ö l çü mlerin kalitesinin belirlenmesi i ç in, istatistik hesaplamalar kullan l r. Bu hesaplamalar yoluyla, deney sonu ç lar na ne kadar g ü venilebilece ğ i, sonu ç lar n da ğ l m ( stnd .sapma = kesinlik) ve farkl zamanlarda yap lan ö l çü mler aras ndaki benzerlik veya farklar tespit edilebilir. Baz istatistik uygulamalar : Tekrarlanan sonu ç lar n ortalamas merkez olmak ü zere, pop ü lasyon 1) ortalamas n n (da ğ l m n) belirli bir y ü zdede yer almas beklenen say sal bir aral kla tan mlanmas amac yla, G ü ven Aral ğ (GA) kullan l r. Deney ortalamas n n, belirli bir olas l kla yine belirli bir aral kta 2) bulunabilmesi i ç in gerekli olan ö l çü m tekrar n n say s n n hesaplanmas . Bir deney ortalamas ile ger ç ek bir de ğ er aras ndaki veya iki deney 3) ortalamas n n farkl olma olas l ğ n n tahmin edilmesi. İ ki ayr ö l çü m i ç in kesinliklerinin farkl olup olmad ğ n belli bir 4) olas l k seviyesinde belirlemek.Baz istatistik uygulamalar (devam ) İ kiden fazla say da numuneden elde edilen ortalamalar , 5) aralar ndaki fark n ger ç ek mi, yoksa rasgele hata sonucu mu oldu ğ unu belirlemek i ç in kar ş la şt rmak. Buna, varyans analizi denir. Tekrar deneyleri sonucu elde edilen ö l çü mlerdeki g ö ze batan 6) sonucun, kaba hatalardan kaynaklan p at labilece ğ ini veya pop ü lasyonun ge ç erli bir ü yesi olarak ortalaman n hesaplanmas nda kullan lmas n n gerekti ğ ini belli bir olas l kla kar ş la şt rmak.Güven Aral ı klar ı : Kimyasal analizlerde, pek çok say ı da ölçüm almadan gerçek ortalama (µ) bulunamaz. Fakat istatistik kullan ı larak, s ı nı rl ı say ı da ölçümle elde edilen ortalama de ğ er ( ) merkez olmak üzere, popülasyon ortalamas ı nı n (µ) belirli bir olas ı l ı kla tayin edilen bir aral ı kta olmas ı beklenir. Bu s ı nı rlara güven s ı n ı r ı , bu s ı nı rlar ı n belirledi ğ i aral ı klara da güven aral ığı denir. X Örne ğ in; potasyum ölçümlerinden elde edilen bir veri tak ı m ı için popülasyon ortalamas ı nı n % 99 olas ı l ı kla % 7,25 ± % 0,15 K oldu ğ unu düş ünelim. Buna göre ortalama de ğ er, % 99 olas ı l ı kla % 7,10 ile % 7,40 K aral ığı nda yer almal ı dı r.? Biliniyorken veya s nin ? ya Yak ı n Oldu ğ u Durumlarda Güven Aral ığı A ş a ğı da verilen Gauss e ğ rilerinde ba ğı l frekans, standart sapma olan z büyüklüğ ünün bir fonksiyonu olarak grafi ğ e geçirilmi ş tir. Gölgeli alanlardaki say ı lar, z nin bu de ğ erleri aras ı nda kalan e ğ rinin alt ı ndaki toplam alan ı n yüzdesidir. G ü ven seviyesi B a ğ l f r e k a n s , y / N B a ğ l f r e k a n s , y / N B a ğ l f r e k a n s , y / N B a ğ l f r e k a n s , y / N B a ğ l f r e k a n s , y / NBilinen bir mevcutsa ve tek bir ? ? ö l çü m ü yap lm şsa, pop ü lasyon ortalamas n n ? ?± z aral ğ nda olmas gerekir. Buradaki z de ğ eri kabul edilen g ü ven seviyesine ba ğ l bir istatistiki parametredir. z de ğ eri, bir sonucun pop ü lasyon ortalamas ndan sapmas n n standart sapmaya g ö re ka ç kat oldu ğ unu g ö sterir. Daha ö nce a şa ğ daki e şitli ğ i incelemi ştik : (x) z ? ? ? ? Yukar daki e şitlik t ü retildi ğ inde; için GA z ??? ?? bulunur. Fakat tek bir ö l çü mle do ğ ru de ğ er tahmini do ğ ru olmaz; bu nedenle N tane ö l çü m ü n deneysel ortalamas n ( ) kullan r z. Bu durumda, x yerine ve yerine ortalaman n standart hatas kullan l r. X X (/) N ? için GA z X N ? ? ? ? Bilinmedi ğ i Durumda G ü ven Aral ğ y genelde s n rl numune say s ve k s tl zaman nedeniyle do ğ ru bi ç imde hesaplamam z g üç le şir. Bu durumda g ü ven s n rlar da olduk ç a geni şler. Ö rne ğ in, % 95 g ü ven seviyesinde 2 serbestlik derecesi i ç in t de ğ eri 4,30 iken, ayn durum i ç in z de ğ eri 1,96 d r. Dikkat : Ger ç ek ortalamalar kullan ld ğ nda veya ç ok say da (N > 10), N i ç in ortalamas al nan ö l çü m say s terimi kullan l rken, s n rl say da numune ile ç al ş l rken N-1 yani serbestlik derecesi ifadesi kullan lmal d r Ç e ş itli olas l k de ğ erleri i ç in t de ğ erleri Serbestlik derecesi için GA ts X N ? ??z testi, t testi, z testi ve t testi, birbirinden farkl iki seri deney sonucu aras ndaki ili şkinin olup olmad ğ n g ö stermek amac yla kullan l r. Ç ok fazla say da anlaml de ğ er ö l çü lm üş se veya de ğ eri biliniyorsa test istatisti ğ inin ad z testi ad n al rken, de ğ erinin bilinmedi ğ i s n rl say daki ö l çü mler i ç in t testi ad n almaktad r. Ö rne ğ in: Birka ç y l boyunca yap lan deneylerin bir sonucu olarak kur şunun ortalama seviyesi 0,02 ppm olarak bulunmu ştur. Diyelim ki baz etkenler nedeniyle bu de ğ erin de ğ i şti ğ inde şü phe duyulsun. En son yap lan ö l çü m, 0,03 ppm olsun. En basit yoldan, aradaki fark n al nmas yla iki sonucun birbirine olan yak nl ğ ya da de ğ i ş im miktar bulunabilir. Veya bulunan sonu ç ile do ğ ru de ğ er aras ndaki z de ğ eri hesaplanarak, istenilen g ü ven s n rlar i ç indeki z de ğ eri ile kar ş la şt r larak, deney sonucunun do ğ ru sonu ç tan ne kadar sapt ğ hakk nda istatistiki bir anlam ç kart l r. z veya t testini kullanabilmek i ç in do ğ ru olarak bilinen veya do ğ ru kabul edilen de ğ erin ? bilinmesi şartt r. 0 X z /N ? ? ? ?Ö rnek Bir s n fta bulunan 30 ö ğ renci, kimyasal bir reaksiyonun aktifle şme enerjisini 27,7 kcal / mol (ortalama de ğ er) olarak tayin etmi şler ve bu tayindeki standart sapma 5,2 kcal / mol olarak hesaplanm şt r. Bu de ğ er literat ü rde verilen 30,8 kcal / mol ile % 95 g ü ven seviyesinde 1) % 99 g ü ven seviyesinde, uyumlu mudur ? 2) 0 277308 326 5230 X ,, z, /N,/ ? ? ? ? ?? ? ? N = 30 ve > 10 oldu ğ undan, s de ğ eri de ğ eri olarak al nabilir. Tablodan bak ld ğ nda % 95 g ü ven seviyesi i ç in z de ğ eri ( z kritik ) ± 1,96 , % 99 g ü ven seviyesi i ç in ( z kritik ) ± 2,58 dir . z -1,96 oldu ğ unda hipotez reddedilir. Bu durumda, % 99 g ü ven seviyesi ko şulu da red olunur. Sonu ç olarak; ö ğ renci ortalamas n n literat ü rdeki verilerden ger ç ekte farkl oldu ğ unu ve bu fark n tam olarak rasgele hatalardan kaynaklanmad ğ konusunda fikir sahibi olduk.İ ki deneysel Ortalaman n Kar ş la şt r lmas , t testi t testi, iki veri setinin ortalamalar aras ndaki fark n ger ç ek mi yoksa rasgele hatalardan m kaynakland ğ n bulmak amac yla kullan l r. E ğ er sonu ç lar n do ğ rulu ğ una g ü veniliyorsa (sistematik bir hata yoksa) analizi yap lan iki maddenin ayn olup olmad ğ na karar vermek amac yla da kullan labilir. İ ki farkl sette ç ok fazla say da ö l çü m yap lm yorsa (N < 10) yap lan test, t testi ad n al r. Daha sonra bulunan t de ğ eri, istenilen belirli bir g ü ven seviyesi i ç in ç izelgelerden elde edilen kritik t de ğ eri ile kar ş la şt r l r. 12 12 12 birle ºik XX t NN s NxN ? ? ? 1. Anali zci taraf ndan N 1 tane deney tekrar i ç in 1 ve 2.analizci taraf ndan N 2 tane deney tekrar i ç in 2 ortalama de ğ erlerinin bulundu ğ unu varsayal m. Bu durumda t ü retilen t istatisti ğ i a şa ğ daki şekilde form ü le edilir. X XÖ rnek İ ki şarap f ç s , farkl kaynaklardan gelip gelmediklerini anlamak amac yla alkol i ç erikleri bak m ndan analiz edilmi ştir. Yap lan 6 analizden birinci f ç daki ortalama alkol i ç eri ğ i % 12,61 etanol olarak bulunmu ştur. İ kinci f ç i ç in yap lan 4 analizin ortalamas da % 12,53 etanol olarak bulunmu ştur. 10 analizin birle şik s de ğ eri olarak % 0,070 elde edilmi ştir. Bu veriler, şaraplar aras nda bir fark oldu ğ unu g ö sterir mi? t i ç in kritik de ğ er, % 95 g ü ven seviyesinde ve 10-2=8 serbestlik derecesi i ç in, 2,31 dir . 1,771<2,31 oldu ğ undan, % 95 g ü ven seviyesinde bu iki şarap ayn kaynaktan gelmektedir. 12 12 12 12611253 1771 64 0070 64 birle ºik XX ,, t, NN , s x NxN ? ? ?? ? ??Kesinliklerin Kar ş la şt r lmas İ ki pop ü lasyonun varyanslar n n yada standart sapmalar n n kar ş la şt r lmas i ç in F testi kullan l r. F testi i ç in gerek şart pop ü lasyonlar n normal gauss da ğ l m g ö stermeleridir. Bunun i ç in ö l çü m say s n n fazla olmas F testini olan g ü veni de g üç lendirir. F testi ayn zamanda ikiden daha ç ok say da ortalaman n kar ş la şt r lmas nda ve do ğ rusal regresyon analizinde kullan l r. % 5 olas l k seviyesi (% 95 g ü ven seviyesi) i ç in kritik F de ğ erleri Serbestlik derecesi (pay) Serbestlik Derecesi (payda)Ö rnek Gaz kar ş mlar ndaki karbon monoksidin tayini i ç in bir standart y ö ntemin y ü zlerce ö l çü m ü nden 0,21 ppm CO lik bir standart sapmaya sahip oldu ğ u bilinmektedir. Y ö ntemin de ğ i ştirilmi ş bir şekli, 12 serbestlik derecesi ile, birle şik veri tak m i ç in 0,15 ppm CO lik bir s de ğ eri vermektedir. Yine 12 serbestlik derecesine dayanan ikinci bir de ğ i ştirilmi ş şeklinin standart sapmas 0,12 ppm CO tir. De ğ i ştirilmi ş her iki y ö ntemin, orijinal y ö ntemden ö nemli derecede daha kesin olup olmad ğ n belirleyiniz. Standart y ö ntem i ç in, s std › ya yeterince yak nd r ve pay i ç in serbestlik derecesi sonsuz olarak al nabilir. B ö ylece, F de ğ eri i ç in kritik de ğ er 2,30 dur. Geli ştirilen birinci y ö ntem i ç in F 1 de ğ eri 2,30 dan k üçü kt ü r ve bu y ü zden % 95 g ü ven seviyesinde, kesinlikte bir iyile şme olmad ğ sonucuna var r z. Di ğ erinde ise F 2 de ğ eri 2,30 dan b ü y ü kt ü r ve kesinlikte artma s ö z konusudur. 2 2 1 22 1 021 19 015 std s (,) F, s(,) ? ?? 2 2 2 22 2 021 306 012 std s (,) F, s(,) ??? 2 2 1 22 2 015 156 012 s (,) F, s(,) ? ?? B ö yle bir durum i ç in F kritik de ğ eri 2,69 dur. 1,56 < 2,69 oldu ğ undan, her iki deneysel sonu ç birbirine g ö re kesinlik a ç s ndan farkl l k g ö z etmemektedir.Q Testi Bu y ö ntemde şü pheli veri ile ( X q ) ile ona en yak n de ğ er ( X n ) aras ndaki fark n, yay l ma b ö l ü nmesiyle Q de ğ eri hesaplan r. Bazen, bir veri tak m i ç inde baz de ğ erler rasgele hatalar ile ortaya ç kacak hata aral ğ n n d ş na ç kabilir. Bu sonu ç lar, de ğ erlendirme d ş tutulmal d r. Ancak, bu de ğ erlerin at lmas na karar verilirken baz hesaplamalar yaparak buna karar vermeliyiz. Bu ama ç i ç in Q Testi s k ç a kullan lan basit bir y ö ntemdir. At lmas muhtemel verilere, şü pheli veri denir. B Ü Y Ü K (KABA) HATALARIN BEL İ RLENMES İ qn XX Q W ? ? Bu oran daha sonra ç izelgeden elde edilen kritik Q de ğ eri ile kar ş la şt r l r. Q de ğ eri, Q kritik de ğ erinde daha b ü y ü kse, şü pheli veri belirlenen g ü ven seviyesinde at labilir. Q > Q kritik ise, de ğ er at labilir. Q kritik Red katsay s Q i ç in kritik de ğ erler G ö zlem say s % 90 g ü ven % 95 g ü ven % 99 g ü ven