



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Los mejores documentos en venta realizados por estudiantes que han terminado sus estudios
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Descubre las mejores universidades de tu país según los usuarios de Docsity
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Statistika i trideset karaktera koja moram da napisem
Tipo: Apuntes
1 / 7
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!
Chi-kvadrat raspodela (obeležava se sa χ2, a izgovara kaj-kvadrat) se koristi u mnogo različitih statističkih procedura. Najčešće se koristi za testiranje hipoteze kada su podaci izraženi u obliku frekvenci pri čemu se dobijene frekvence upoređuju sa frekvencama koje se očekuju kada se podaci generišu nekom teorijom ili hipotezom. Što su očekivane frekvence bliže dobijenim to je veća verovatnoća da je H0 ispravna. Izračunavanje se izvodi prema izrazu:
o
d o
2 2
gde je: fd - dobijena frekvenca koja predstavlja broj subjekata (ili objekata) koji pripadaju određenoj kategoriji promenljive
fo - očekivana frekvenca koja predstavlja broj subjekata (ili objekata) koji se očekuju da se pojave u određenoj kategoriji promeljive ako je zadovoljena neka postavljena nulta hipoteza.
Na primer, ako posmatramo bračni status 100 hospitalizovanih pacijenata, možemo doći do zaključka da je 50 oženjenih, 30 samaca, 15 udovaca i 5 razvedenih. Ove vrednosti predstavljaju dobijene frekvence. Očekivane frekvence možemo izračunati ako postavimo nultu hipotezu da su sve četiri kategorije bračnog stanja podjednako zastupljene i u tom slučaju bi ove frekvence iznosi 25 za svaku kategoriju. Izračunata vrednost χ2 predstavlja meru za slaganje para dobijenih i očekivanih frekvenci i ukoliko su one bliske, vrednost χ2 biće mala, a ako se razlikuju među sobom χ 2 će imati veću vrednost. Kako se izračunate vrednosti χ2 za svaki par frekvenci sabiraju, krajnja vrednosti χ 2 predstavlja meru slaganja dobijenih i očekivanih frekvenci za sve kategorije promenljivih.
Chi-kvadrat test se najčešće primenjuje kao test slaganja, test nezavisnosti i test homogenosti.
Test slaganja
Test slaganja se primenjuje kada želimo da proverimo da li se raspodela dobijenih frekvenci slaže sa nekom unapred određenom raspodelom. Test se izvodi tako da se dobijene vrednosti organizuju u klasne intervale i zabeleže dobijene frekvence, a potom se za svaki interval izračunaju frekvence koje se očekuju za pretpostavljenu raspodelu (normalnu, binomnu ili neku drugu). Razlika između dobijenih i očekivanih frekvenci testira se chi-kvadrat testom i ako se pokaže da nije značajna, odnosno da možemo da prihvatimo nultu hipotezu krajnji zaključak je da su dobijeni podaci deo testirane raspodele.
PRIMER 1 .: U serumima 125 zdravih osoba određeni su hloridi (vrednosti su date u mmol/L) i potrebno je proveriti da li je raspodela dobijenih vrednosti normalna. U tabeli su prikazane sve vrednosti grupisane u klasne intervale širine 2 mmol/L sa dobijenim apsolutnim frekvencama:
2 Statistika u farmaciji
Ki=2 mmol/L f 92,0-93,9 2 94,0-95,9 8 96,0-97,9 14 98,0-99,9 17 100,0-101,9 30 102,0-103,9 20 104,0-105,9 17 106,0-107,9 9 108,0-109,9 6 110,0-111,9 2 125
Da bismo proverili da li je dobijena raspodela frekvenci normalna potrebno je da za svaki klasni interval izračunamo frekvence koje se očekuju za normalnu raspodelu. Za to izračunavanje su
= 3,75474 mmol/L. Očekivane frekvence se izračunavaju prema izrazu za standardnu jedinicu
, kao što je to pokayano u poglavlju "Normalna raspodela".
Sledeći korak u izračunavanju je da proveri da li postoji slaganje između dobijenih i očekivanih frekvenci, odnosno da se primeni χ2 -test.
Ki=2 mmol/L fd fo (fd - fo)^2 /fo 92,0-93,9 2 2,04 0, 94,0-95,9 8 5,80 0, 96,0-97,9 14 12,88 0, 98,0-99,9 17 20,76 0, 100,0-101,9 30 25,83 0, 102,0-103,9 20 24,80 0, 104,0-105,9 17 17,35 0, 106,0-107,9 9 9,43 0, 108,0-109,9 6 3,89 1, 110,0-111,9 2 1,22 0, ukupno 125 4,
Izračunata vrednost χ2 iznosi 4,886 i treba je uporediti sa kritičnom vrednošću za izabranu verovatnoču i odgovarajući broj stepena slobode. Za χ2 raspodelu broj stepena slobode iznosi k - r, gde je k broj klasnih intervala za koje se porede dobijene i očekivane frekvence, a r je broj ograničenja za dato poređenje. Za test slaganja koji se radi kao što je pokazano u prethodnom primeru broj ograničenja je jednak 3: prvo ograničenje je to što je suma dobijenih i izračunatih frekvenci jednaka sumi izračunatih, a ostala ograničenja su broj parametara koji se izračunavaju iz podataka, u ovom slučaju srednja vrednost i standardna devijacija. Za verovatnoću 0,05 i broj
4 Statistika u farmaciji
Na isti način se izračunaju ostale očekivane frekvence, koje su prikazane u tabeli. Ukupan broj očekivanih frekvenci za svaku grupu ponašanja, kao i za svaku grupu uživaoca droge isti je kao i ukupan broj dobijenih frekvenci. Sledeći korak u izračunavanju je da se očekivane frekvence uporede sa dobijenim i izračuna χ2 vrednost, što je prikazano u tabeli. Broj stepena slobode za ovaj primer je (4-1)(3-1)=6, a kritična vrednost χ2 za 6 stepena slobode i verovatnoću 0,05 je 12,592. Iz tabele se vidi da je izračunata vrednost χ2 veća od tablične, što znači da dva kriterijuma klasifikacije nisu nezavisni, odnosno postoji zavisnost između nivoa uživanja marihuane i poremećaja u ponašanju.
nivo uživanja droge dominantno ponašanje lako srednje teško
ukupno
nesanica 8,14 6,38 7,48 22 agresivnost 13,32 10,44 12,24 36 prolazna psihoza 8,88 6,96 8,16 24 neogovarajuće ponašanje 6,66 5,22 6,12 18 ukupno 37 29 34 100
red, kolona fd fo (fd-fo)^2 /fo 1, 1 10 8,14 0, 1, 2 5 6,38 0, 1, 3 7 7,48 0, 2, 1 11 13,32 0, 2, 2 7 10,44 1, 2, 3 18 12,24 2, 3, 1 6 8,88 0, 3, 2 11 6,96 2, 3, 3 7 8,16 0, 4, 1 10 6,66 1, 4, 2 6 5,22 0, 4, 3 2 6,12 2, ukupno 100 100,00 (^) χ^2 =13,
Test homogenosti
Test homogenosti se matematički identičan testu nezavisnosti, ali je nulta hipoteza koja se kod njega postavlja drugačija. Kod testa nezavisnosti klasifikacija vrednosti prema dva kriterijuma izvodi se tek pošto se sakupi kompletan uzorak, odnosno u prethodnom primeru su istraživači prvo prikupili 100 uživaoca marihuane, a potom su ih razvrstali prema zadatim kriterijumima. Zbog toga ukupan broj podataka u redovima i kolonama ne zavisi od istraživača, a nulta hipoteza koja se postavlja treba da odgovori na pitanje da li su dva kriterijuma klasifikacije nezavisni.
Međutim, ako se podaci prikupljaju tako da se unapred odredi ukupan broj podataka prema jednom kriterijumu klasifikacije, onda će ukupan broj podataka prema drugom kriterijumu biti nezavisan od istraživača. Drugim rečima, dve ili više grupa identifikuju se unapred prema jednom kriterijumu, a potom se dalje klasifikuju prema drugom kriterijumu. Nulta hipoteza koja se u ovom
S. Spasić. Predavanja 2009/2010 5
slučaju postavlja treba da odgovori na pitanje da li su unapred određene grupe homogene u odnosu na drugi kriterijum klasifikacije, pa se stoga test i zove test homogenosti.
PRIMER 4.: Kod različitih bolesti jetre i to: akutnog virusnog hepatita (19 pacijenata), hroničnog virusnog hepatita (20 pacijenata), ciroze jetre (17 pacijenata) i holelitijaze (14 pacijenata) određena je aktivnost ksantin oksidaze-O. Dobijeni sledeći rezultati: kod akutnog virusnog hepatita 13 povišenih vrednosti, kod hroničnog virusnog hepatita 7 povišenih vrednosti, kod ciroze jetre 2 povišene vrednosti i kod holelitijaze 3 povišene vrednosti. Treba pokazati da li su navedene grupe pacijenata homogene u odnosu na pojavljivanje patoloških vrednosti navedenog enzima.
U ovom primeru su grupe pacijenata unapred razdvojene, a zatim su razvrstane prema vrednosti ispitivanog enzima.
ksantin oksidaza-O grupa normalna povišena
ukupno
akutni virusni hepatit 6 13 19 hronični virusni hepatit 13 7 20 ciroza jetre 15 2 17 holelitijaza 11 3 14 ukupno 45 25 70
Očekivane frekvence se izračunavaju na isti način kao kod testa nezavisnosti, odnosno za svako polje množenjem ukupnog broja podataka u redu sa ukupnim brojem podataka u koloni i deljenjem sa ukupnim brojem podataka. Dobijene očekivane frekvence prikazane su u tabeli.
ksantin oksidaza-O grupa normalna povišena
ukupno
akutni virusni hepatit 12,21 6,79 19 hronični virusni hepatit 12,86 7,14 20 ciroza jetre 10,93 6,07 17 holelitijaza 9,00 5,00 14 ukupno 45 25 70
Očekivane frekvence uporede se sa dobijenim i izračuna vrednost χ2 , kao što je prikazano u tabeli. Broj stepena slobode je jednak (4-1)(2-1)=3, a kritična vrednost χ2 za 3 stepena slobode i verovatnoću 0,05 jednaka je 7,815. Kako je izračunata vrednost χ2 veća od kritične postavljena nulta hipoteza se odbacuje i zaključak je da posmatrane grupe pacijenata nisu homogene u odnosu na dobijene patološke vrednosti ksantin oksidaze-O. Drugim rečima, frekvenca pojavljivanja patoloških vrednosti ovog enzima nije ista kod ispitivanih bolesti.
red, kolona fd fo (fd-fo)/fo 1, 1 6 12,21 3, 1, 2 13 6,79 5, 2, 1 13 12,86 0, 2, 2 7 7,14 0,
S. Spasić. Predavanja 2009/2010 7