Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad

Kaj kvadrat test u farmaciji, Apuntes de Estadística

Statistika i trideset karaktera koja moram da napisem

Tipo: Apuntes

2018/2019

Subido el 08/10/2019

teodora.tess
teodora.tess 🇦🇷

3 documentos

1 / 7

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Chi-kvadrat test
Chi-kvadrat raspodela (obeležava se sa χ2, a izgovara kaj-kvadrat) se koristi u mnogo različitih
statističkih procedura. Najčće se koristi za testiranje hipoteze kada su podaci izraženi u obliku
frekvenci pri čemu se dobijene frekvence upoređuju sa frekvencama koje se očekuju kada se podaci
generišu nekom teorijom ili hipotezom. Što su očekivane frekvence bliže dobijenim to je veća
verovatnoća da je H0 ispravna. Izračunavanje se izvodi prema izrazu:
(
)
=χ
o
od
f
ff
2
2
gde je:
fd - dobijena frekvenca koja predstavlja broj subjekata (ili objekata) koji pripadaju određenoj
kategoriji promenljive
fo - očekivana frekvenca koja predstavlja broj subjekata (ili objekata) koji se očekuju da se pojave
u određenoj kategoriji promeljive ako je zadovoljena neka postavljena nulta hipoteza.
Na primer, ako posmatramo bračni status 100 hospitalizovanih pacijenata, možemo doći do
zaključka da je 50 oženjenih, 30 samaca, 15 udovaca i 5 razvedenih. Ove vrednosti predstavljaju
dobijene frekvence. Očekivane frekvence možemo izračunati ako postavimo nultu hipotezu da su sve
četiri kategorije bračnog stanja podjednako zastupljene i u tom slučaju bi ove frekvence iznosi 25 za
svaku kategoriju. Izračunata vrednost χ2 predstavlja meru za slaganje para dobijenih i očekivanih
frekvenci i ukoliko su one bliske, vrednost χ2 biće mala, a ako se razlikuju među sobom χ2 će imati
veću vrednost. Kako se izračunate vrednosti χ2 za svaki par frekvenci sabiraju, krajnja vrednosti χ2
predstavlja meru slaganja dobijenih i očekivanih frekvenci za sve kategorije promenljivih.
Chi-kvadrat test se najčće primenjuje kao test slaganja, test nezavisnosti i test homogenosti.
Test slaganja
Test slaganja se primenjuje kada želimo da proverimo da li se raspodela dobijenih frekvenci
slaže sa nekom unapred određenom raspodelom. Test se izvodi tako da se dobijene vrednosti
organizuju u klasne intervale i zabeleže dobijene frekvence, a potom se za svaki interval izračunaju
frekvence koje se očekuju za pretpostavljenu raspodelu (normalnu, binomnu ili neku drugu). Razlika
između dobijenih i očekivanih frekvenci testira se chi-kvadrat testom i ako se pokaže da nije
značajna, odnosno da možemo da prihvatimo nultu hipotezu krajnji zaključak je da su dobijeni podaci
deo testirane raspodele.
PRIMER 1.: U serumima 125 zdravih osoba određeni su hloridi (vrednosti su date u mmol/L) i
potrebno je proveriti da li je raspodela dobijenih vrednosti normalna. U tabeli su prikazane sve
vrednosti grupisane u klasne intervale širine 2 mmol/L sa dobijenim apsolutnim frekvencama:
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Kaj kvadrat test u farmaciji y más Apuntes en PDF de Estadística solo en Docsity!

Chi-kvadrat test

Chi-kvadrat raspodela (obeležava se sa χ2, a izgovara kaj-kvadrat) se koristi u mnogo različitih statističkih procedura. Najčešće se koristi za testiranje hipoteze kada su podaci izraženi u obliku frekvenci pri čemu se dobijene frekvence upoređuju sa frekvencama koje se očekuju kada se podaci generišu nekom teorijom ili hipotezom. Što su očekivane frekvence bliže dobijenim to je veća verovatnoća da je H0 ispravna. Izračunavanje se izvodi prema izrazu:

o

d o

f

f f

2 2

gde je: fd - dobijena frekvenca koja predstavlja broj subjekata (ili objekata) koji pripadaju određenoj kategoriji promenljive

fo - očekivana frekvenca koja predstavlja broj subjekata (ili objekata) koji se očekuju da se pojave u određenoj kategoriji promeljive ako je zadovoljena neka postavljena nulta hipoteza.

Na primer, ako posmatramo bračni status 100 hospitalizovanih pacijenata, možemo doći do zaključka da je 50 oženjenih, 30 samaca, 15 udovaca i 5 razvedenih. Ove vrednosti predstavljaju dobijene frekvence. Očekivane frekvence možemo izračunati ako postavimo nultu hipotezu da su sve četiri kategorije bračnog stanja podjednako zastupljene i u tom slučaju bi ove frekvence iznosi 25 za svaku kategoriju. Izračunata vrednost χ2 predstavlja meru za slaganje para dobijenih i očekivanih frekvenci i ukoliko su one bliske, vrednost χ2 biće mala, a ako se razlikuju među sobom χ 2 će imati veću vrednost. Kako se izračunate vrednosti χ2 za svaki par frekvenci sabiraju, krajnja vrednosti χ 2 predstavlja meru slaganja dobijenih i očekivanih frekvenci za sve kategorije promenljivih.

Chi-kvadrat test se najčešće primenjuje kao test slaganja, test nezavisnosti i test homogenosti.

Test slaganja

Test slaganja se primenjuje kada želimo da proverimo da li se raspodela dobijenih frekvenci slaže sa nekom unapred određenom raspodelom. Test se izvodi tako da se dobijene vrednosti organizuju u klasne intervale i zabeleže dobijene frekvence, a potom se za svaki interval izračunaju frekvence koje se očekuju za pretpostavljenu raspodelu (normalnu, binomnu ili neku drugu). Razlika između dobijenih i očekivanih frekvenci testira se chi-kvadrat testom i ako se pokaže da nije značajna, odnosno da možemo da prihvatimo nultu hipotezu krajnji zaključak je da su dobijeni podaci deo testirane raspodele.

PRIMER 1 .: U serumima 125 zdravih osoba određeni su hloridi (vrednosti su date u mmol/L) i potrebno je proveriti da li je raspodela dobijenih vrednosti normalna. U tabeli su prikazane sve vrednosti grupisane u klasne intervale širine 2 mmol/L sa dobijenim apsolutnim frekvencama:

2 Statistika u farmaciji

Ki=2 mmol/L f 92,0-93,9 2 94,0-95,9 8 96,0-97,9 14 98,0-99,9 17 100,0-101,9 30 102,0-103,9 20 104,0-105,9 17 106,0-107,9 9 108,0-109,9 6 110,0-111,9 2 125

Da bismo proverili da li je dobijena raspodela frekvenci normalna potrebno je da za svaki klasni interval izračunamo frekvence koje se očekuju za normalnu raspodelu. Za to izračunavanje su

nephodne srednja vrednost i standardna devijacija koje za ovaj skup iznose x^ = 101,577 mmol/l i Sd

= 3,75474 mmol/L. Očekivane frekvence se izračunavaju prema izrazu za standardnu jedinicu

Sd

x-x

z =

, kao što je to pokayano u poglavlju "Normalna raspodela".

Sledeći korak u izračunavanju je da proveri da li postoji slaganje između dobijenih i očekivanih frekvenci, odnosno da se primeni χ2 -test.

Ki=2 mmol/L fd fo (fd - fo)^2 /fo 92,0-93,9 2 2,04 0, 94,0-95,9 8 5,80 0, 96,0-97,9 14 12,88 0, 98,0-99,9 17 20,76 0, 100,0-101,9 30 25,83 0, 102,0-103,9 20 24,80 0, 104,0-105,9 17 17,35 0, 106,0-107,9 9 9,43 0, 108,0-109,9 6 3,89 1, 110,0-111,9 2 1,22 0, ukupno 125 4,

Izračunata vrednost χ2 iznosi 4,886 i treba je uporediti sa kritičnom vrednošću za izabranu verovatnoču i odgovarajući broj stepena slobode. Za χ2 raspodelu broj stepena slobode iznosi k - r, gde je k broj klasnih intervala za koje se porede dobijene i očekivane frekvence, a r je broj ograničenja za dato poređenje. Za test slaganja koji se radi kao što je pokazano u prethodnom primeru broj ograničenja je jednak 3: prvo ograničenje je to što je suma dobijenih i izračunatih frekvenci jednaka sumi izračunatih, a ostala ograničenja su broj parametara koji se izračunavaju iz podataka, u ovom slučaju srednja vrednost i standardna devijacija. Za verovatnoću 0,05 i broj

stepena slobode 7, tablična vrednost χ 2 iznosi 14,067, a pošto je izračunata vrednost x^ manja od

4 Statistika u farmaciji

22 x 37

fo(1,1)=

Na isti način se izračunaju ostale očekivane frekvence, koje su prikazane u tabeli. Ukupan broj očekivanih frekvenci za svaku grupu ponašanja, kao i za svaku grupu uživaoca droge isti je kao i ukupan broj dobijenih frekvenci. Sledeći korak u izračunavanju je da se očekivane frekvence uporede sa dobijenim i izračuna χ2 vrednost, što je prikazano u tabeli. Broj stepena slobode za ovaj primer je (4-1)(3-1)=6, a kritična vrednost χ2 za 6 stepena slobode i verovatnoću 0,05 je 12,592. Iz tabele se vidi da je izračunata vrednost χ2 veća od tablične, što znači da dva kriterijuma klasifikacije nisu nezavisni, odnosno postoji zavisnost između nivoa uživanja marihuane i poremećaja u ponašanju.

nivo uživanja droge dominantno ponašanje lako srednje teško

ukupno

nesanica 8,14 6,38 7,48 22 agresivnost 13,32 10,44 12,24 36 prolazna psihoza 8,88 6,96 8,16 24 neogovarajuće ponašanje 6,66 5,22 6,12 18 ukupno 37 29 34 100

red, kolona fd fo (fd-fo)^2 /fo 1, 1 10 8,14 0, 1, 2 5 6,38 0, 1, 3 7 7,48 0, 2, 1 11 13,32 0, 2, 2 7 10,44 1, 2, 3 18 12,24 2, 3, 1 6 8,88 0, 3, 2 11 6,96 2, 3, 3 7 8,16 0, 4, 1 10 6,66 1, 4, 2 6 5,22 0, 4, 3 2 6,12 2, ukupno 100 100,00 (^) χ^2 =13,

Test homogenosti

Test homogenosti se matematički identičan testu nezavisnosti, ali je nulta hipoteza koja se kod njega postavlja drugačija. Kod testa nezavisnosti klasifikacija vrednosti prema dva kriterijuma izvodi se tek pošto se sakupi kompletan uzorak, odnosno u prethodnom primeru su istraživači prvo prikupili 100 uživaoca marihuane, a potom su ih razvrstali prema zadatim kriterijumima. Zbog toga ukupan broj podataka u redovima i kolonama ne zavisi od istraživača, a nulta hipoteza koja se postavlja treba da odgovori na pitanje da li su dva kriterijuma klasifikacije nezavisni.

Međutim, ako se podaci prikupljaju tako da se unapred odredi ukupan broj podataka prema jednom kriterijumu klasifikacije, onda će ukupan broj podataka prema drugom kriterijumu biti nezavisan od istraživača. Drugim rečima, dve ili više grupa identifikuju se unapred prema jednom kriterijumu, a potom se dalje klasifikuju prema drugom kriterijumu. Nulta hipoteza koja se u ovom

S. Spasić. Predavanja 2009/2010 5

slučaju postavlja treba da odgovori na pitanje da li su unapred određene grupe homogene u odnosu na drugi kriterijum klasifikacije, pa se stoga test i zove test homogenosti.

PRIMER 4.: Kod različitih bolesti jetre i to: akutnog virusnog hepatita (19 pacijenata), hroničnog virusnog hepatita (20 pacijenata), ciroze jetre (17 pacijenata) i holelitijaze (14 pacijenata) određena je aktivnost ksantin oksidaze-O. Dobijeni sledeći rezultati: kod akutnog virusnog hepatita 13 povišenih vrednosti, kod hroničnog virusnog hepatita 7 povišenih vrednosti, kod ciroze jetre 2 povišene vrednosti i kod holelitijaze 3 povišene vrednosti. Treba pokazati da li su navedene grupe pacijenata homogene u odnosu na pojavljivanje patoloških vrednosti navedenog enzima.

U ovom primeru su grupe pacijenata unapred razdvojene, a zatim su razvrstane prema vrednosti ispitivanog enzima.

ksantin oksidaza-O grupa normalna povišena

ukupno

akutni virusni hepatit 6 13 19 hronični virusni hepatit 13 7 20 ciroza jetre 15 2 17 holelitijaza 11 3 14 ukupno 45 25 70

Očekivane frekvence se izračunavaju na isti način kao kod testa nezavisnosti, odnosno za svako polje množenjem ukupnog broja podataka u redu sa ukupnim brojem podataka u koloni i deljenjem sa ukupnim brojem podataka. Dobijene očekivane frekvence prikazane su u tabeli.

ksantin oksidaza-O grupa normalna povišena

ukupno

akutni virusni hepatit 12,21 6,79 19 hronični virusni hepatit 12,86 7,14 20 ciroza jetre 10,93 6,07 17 holelitijaza 9,00 5,00 14 ukupno 45 25 70

Očekivane frekvence uporede se sa dobijenim i izračuna vrednost χ2 , kao što je prikazano u tabeli. Broj stepena slobode je jednak (4-1)(2-1)=3, a kritična vrednost χ2 za 3 stepena slobode i verovatnoću 0,05 jednaka je 7,815. Kako je izračunata vrednost χ2 veća od kritične postavljena nulta hipoteza se odbacuje i zaključak je da posmatrane grupe pacijenata nisu homogene u odnosu na dobijene patološke vrednosti ksantin oksidaze-O. Drugim rečima, frekvenca pojavljivanja patoloških vrednosti ovog enzima nije ista kod ispitivanih bolesti.

red, kolona fd fo (fd-fo)/fo 1, 1 6 12,21 3, 1, 2 13 6,79 5, 2, 1 13 12,86 0, 2, 2 7 7,14 0,

S. Spasić. Predavanja 2009/2010 7

  1. Kod 33 zdrave osobe, 50 osoba sa različitim nefrološkim dijagnozama i 33 osobe sa kardiološkim bolestima dokazivan je albumin u urinu. Pozitivan rezultat na albumin u urinu dobijen je kod 4 zdrave osobe, 41 pacijenta sa nefrološkim i 8 pacijenata sa kardiloškim oboljenjima. Pokazati da li postoji razlika između učestalosti pojavljivanja pozitivnih rezultata za albumin u urinu kod ovih grupa.