Baixe Resumo P2 Estatística e outras Esquemas em PDF para Estatística, somente na Docsity!
Poste T: entalinida Descritiva! Foco em organização , resumo e descri - ção dos dados, P/ conhecer suas primeiras características. Probabilidade : 0ju- da na modelagem de fenômenos aleatórios com incerteza ne resultado TInferência Estatística: ps tirar conclusões Sobre uma população inteira com as infos de uma amestra Amostragem (melhora viabilidade (custo / tempo) . População: conjunto completo de elementos. Amostra: subcongunto da popula qão seleciona do ps análise. Amestra » pode ser prebabilística [conhece a chance de selecionar um elemento) os não- probabilistiea ( por conveniência, não conhece a chance ) Amostragem aleatéria simples (prob.): elementos têm chance iquais de serem esco Yidos. Etapas : 4) enomeror 06 itens da população da 4 GN; 2) Sortear n números (com ousem seposiçdia ), que Corresponderão à amostra. Amostragem aleatória estrahficada (prob. usada p/ populaçad heterogênca, que vai ser divida tm Subqrupas homogêneos (estratos). Etapas: 4) Dividir a qepelação em estratos (com bose em idade /renda / Sexo /cscotaridado); 2) Deter- minar o tumanho de cada estrato (proporcono€ ou igpolitário) ; 3) MAS em cada estrato. Amostragem aleatória estratificada em 2 etapas (prob.): Etapas: 1) Diviair a pepslação em estrolos (com base em idade /renda / sexo /escotari dade); 2) Seleúonor aleoté ria - mente subcen juntas desses estratos; 2) AS centro de cada grope. Amostragem aleatória por «nglomerades (prob.): população é dividida cm múltiplos grupos (conglomerados). Etaças: 4) Dividir a população em conglomerados Lescola /boutro/ekc); 2 ) Seleenar aleatoriamente subcen- ápntos desses conglemerados. 3)Tados os indtvídivos dos conglomerados 5o estudados. Amostra- gem aleatória por conglomerados em Z etapas Lprob.): Etapas: 4) 0€ norma; 2) Definir o tamanho da amostra retirada da cada conglomerado Lero gorclonar ou tgpalitário); 3) RAS emcado congiamerodo. Conglomerado « Homogêneoentre si e heterogêneo internamente. Estrato: heterogêneo entre 5; e homagêndo internamente. fimostragem aleatória siste - mática L prob): elementas salcianados à gartie de um penta de qartida alaakóré tertodo fixo e periódico. Etagos: 1) Determinar o intervado Ke: Ka N7n4 Tamenhofio/ Tamanho armestra desejado | 2) Selecionar um wºelealócio entre 1 € K como gonto de cortida,; 3) Selecionar as elementos segindo X. X Se Samanhepop-(4) = €o ou detconhedo, escalher K arbitrário j Problemas periodi Conceitos Experimento aleatório: pode ser repetido é o resultado é incerto. Espaço amostrae (1): Conjunto des resultados possíveis de um exp. aleatória, Evento : Subconjenho do 2. O próprio 1 Éum evento / Dparações Com aventos União (AUB): oconrese À, ou 8, oo ambos oxorrem. Tntevseçõo (AMB): ocomese ne B owrreca. Complementar (Rº) : ocorre se A não otwrrer. União generalizada (UA) ocorre se pelo menos um (Gu,..., An) ocorrer. Tnterseção generalizada | /) Ai): oxorre se to - A dos (As... An) otoreerem. mutoamente excludente 5 (AN 6= 0): não podem ocorrer gun” tos. Probabilidade: P(A) = nºalementos em A Znº elementos em 2. Uma função que atribui a cada evento um valor de 0a 4 (entrada: AC; Saída: PLADE [0,47). Propriedades e axiomas «p(n)=1. 2 2P(A)20 — probabilidade de qualquer evento é noo- negativa e menor ques. » Se fic € envlvamente exelv - dentes: ELAUE) = PlM) + P(8) + PLB)=0 -+ erobebilidade de um evento impos- síve » P(Aº)= 4- PLA) — probabilidade de uro evento não ocorser »Se RE sud- conjunto de 8 (Ace): PID SPC PLANB)- P(A)-PLANB) — erobobil: dade de À acontecer € Bnão acontecer + p LAUB) = PlA)+P(B)- PLANB) e pre vebilidade de A qu & acontecer ( princípio da inclusão - exclusão) + Probabilidade e. PLAlO)= PLANB)/PLG) — Aocorrer dodo que Bounceu a Regra da condiconal rama da árvore: Pdo molhiglicação : PLAN B)= PLAIS)-P(S)= PLBIR)-PLA) » Diag resultado finol = molfiplicar P de cada gelho + Multiplicação genoralizada: PANDA BI)= ELA Nim No) = PLA) PERLA - PLAs LONA) PCR LA MAMA). « Porticionamento do espaço amostree: PLA) = P(BIB). PCB) 4 P(A 16). P(8) Soges: P(AIS) = PLBIA) p(n)/ pl) « Independênga de eventos: * Teorema de se PLANO). PLG-PUH) indeçendentes q rela cut que coincide com x. Amostragem por conveniência (5- prob): Amestra selecionada por converiênda « facilidade da acesso. objetivo, arbitrório., sem mt rigor cento + amostra sem mata representatiidode. A chance de de vm Indivídua Sex selecionado é desconheúda. Análise exploratória variáveis qualitativas: representam obribulos Zqualidades ( nomi P E) a nal: Semordem ; Ordinal: com ordeen /Hierarqua /grau /Intensidade). variáveis quantilalivas: assumem volores numéricas LDiscrela: inteiros e contáveis ; Continvar qualquer votir.) Frequência raSrm SE FREGuEnGia AbS (ni): hº de vezes que um velor apareça. Frequência Relativa (fi): jesite or[ê [fre] pregerção com que um valor aparece: Rmi/n. Frequência Acumulado Toy (Enc): soma acumulada das $4's- Gráfico Dispersão: pt visualisor a reta - cão entre duas variáveis quntitabivas, Eloto, partos no elano cartesiano Enter reta O comportamento de uma em relação & outra. Gráfico Setores /Pizto: mostra a proporção de tada categoria. Desaconselhado, di fine visuolisar, melhor star barcas. trafiu Barras: mostra frequências ou. de categorias [eixo q ) e seusvolores no eixos intevesse da altura, Mistogramo: distribuição da tabela de frequência. agrupada em clossas (bem pf variável quantidativa contínuo). Interesse na concentração dos valores py cada vartávee. ep fofa Boxplot: Primeiro quartil Las) : 287 obaixo e 357. acima, = Lygia)” “SE segundo Quor M(Qa): madtiana e SO7. abaixo, SO7 acima; Tercerro quartil (Da): 157.0boixo e 257. ama, Qo=X su (ns); Amplitude interquarki (AIG): AIQu Q3- Qu; Limite sopertor:L5=09 + 15 -PTQ; limpe inferior-LE = Qu - 4,5: REQ 4 quartil não é inteiro “e mégia do elemento da parte Função de probabilidade: plxi)= PlX= x.1). Função ae atstribução nwmolada : Ftx)= Plxgae), Esperanca (varor esperado): ETXI= Psi e sax. mi: PCR. Variôncas Varta) = E [x2]- (EO)? com E [xt]= Px e sax 264 Plx e xi) Desv. Pads DP(x)= VVartay: Coe. Variação: CV = DP(x) /EDA. Propriedades: Efax+b)s a EDTA j E Dest tX0]= Ee) 4ER] ; Voe Coxa) = alva it içÕo delam.. Distribuições Discretas medelam, so ptge soassos em neníoios de Gernoullt independentes er 0 prob. de sucesso (e)=ere Bernoulli: experimento, 2 vesulta dos pos síveis : sucesso e Pracasso (oe 4) , no «EP: Pets lceado (apt PERL: Plemce)= (8) PCA) px Oman eme ED a: prO ata =P Leve: EDO- ne e var vargas pataa-pio pie pl | SO aros elo) eramos ' 5 Poisson: ne de ocovrê ncias de sm evento em tm intervalo de tempo, Quondo a taxa média de otorêneia À é tonheúda. + FPe Plgex) EN N/xX sernr0 PAZ! «VE Ever: EDJ=Varto= À e o série de Taylor centrada em qeso i do elem : : ntsira e do element Seco”. Mo gigas de dispersão -»p) cetermir todo o congento de dedos em um 00 mais valores. média Aritmética LE): 5 fm. Nem Sempre É :/ Sus a.for centroe de um vma bea gois é mtinflventiada por cutlter. Média ponderada: Fu modaivalor que mais se vepate (pode ter mais de um) mediana conjunto de dados ordenado n par > Qu= (Xnsa + Etna )/ À; niroparr Que Xenennra Neo é sensívee a cores Medidas de dispersão = gundo es de posição não São suficentes para deseever o tom portamento dos dados: Indicar o gra de voriabilidade /aspolhamento dos dados em forro da centro. Amplitude : Aura = volor máx - volor mín. Desvio médio absoluto: vê o quanto os valores, em médio, se distanciam da. me'aia. É Sempre positivo. oMAGO = Blxi-=1/n vociânca: mede a dispersão dos dados em relação âmédia: 0% Sx;-E)*/n + penaliza grendes desvias € não dá um valor ne mem unidade dos dados. Não ler inter eretoção direta, emos pode ser usada py comparação. Desvio padrão o quanto os valores, em cmádiio, se distom TF pvoriântia:. 4 Tem interoratação prático pois volta pt unidade + Se 0 ciara da médio: O = dervio padrão E pequeno em relação à arnplilude 1otal; a maioria dos dados está prá Ximo do médio, do contrário, estão mais espalhados .loe f. de Variação : medida de dispersão rela tiva: CV = 0/4 Em geral molplica por 100 py Ser 7). Boro pr Comparar conjuntos de dados com diferentes estas / médias. + Quanto menor o CV, dados mais homogêneos: iltdade boixa, 0146w < 02 > variabilidade intermediária, 02tCVC 0,3 + cv 0,804 var vortebiltdade alto, Cv 2.0.5 + variabi + alto - A E tebiltdade alta, cv 2.0.5 - variabiltdade mr Medidas de posição Felativos Quortis. Escores padronizados: ar =[x:- =) /d. Plcomporar vatores de diferentes disteiburções (teloco na mem escala. mostra a quantos" "um valor estó do médio. + Um conjunto de E/S tem Smp médio O e varrândia 4. Teorema Chebyshev: Pelo meros (4-4/2%) dos dadas estão denteo de 2 [94r valor Y1 ) "desvios-padrão de médio, qu seja : estão no intervalo (E 2015 "20 odidas de Assodação — medem à relação ntee duas o» mois varicveis.Covariâncias: mede o grau de ameniação lincar enxe duas varicveis covtuy)= E (xi-Egi-B)/n. à unidade de medida é o produto das unidades de medida, de e ot. à difícil estabelecer comparações pois da pende da escola des dados .Coef. de cor relação: mede o força e a direção da assoúação linear entre Ro | É] Bla | Gontlasõo et Treo, Fraco [rederado, Torta mt Forte [or = 2.3 [0.10 a 0139 focto 0,68 [oo + 0,5 ade 1 . É uma duos variáveis. Cor Guy) = Px) = a/n- s( O 6x medida padronizada, que não de pende da esta dos dados. p varta de -4 (correlação negosiva gerferta ) a 44 (correlação posiiva per fai ta), Sendo O à ausência de correlação. 4 Correlação não implica. causalidade (pode ser fortemente correlationade sem causar uma o cetra). Parte 2: o clássico: Eumo Peaçõo -» Qesultados favorveis 7 a são igualmente prováveis. Frequentista: E à fre quén Resultados possíveis. Todes os resultado: relação cics com que ceuento.U tone qnd se repete o experimento muitos vezes. Lógico: é a entre proposições Sayesiana (subjelivisto): não existe. Representa o gras de evença na otov- rência deum avento Lpode mudar tom nevos eidéncios) | (pédios/senhas É filos plata de carro) fAn,ps n!/(n-PI!. Combinação (ordem 5 imposta): ( grupos, comitês) Crsg Yotranio cria resultados + VAR. Aleakórias Contínvas — assumem Qg" valor + à dá pi okaibuit proba - bilidade em um ponto, Sé em intervalo de reta. Uma variável = É contínua se $(=)%0 prlodox e (Eieiax es. Função densigode de probabilidade: Pla + x £b)= Jeso dx e PlX=ajrO- Função de distribuição acmulado: Fily)= PLY E4) ço ENC ESEROS [EE 0): or: Nortad= ElxI- (EGO, com EI Distribuição Normal Padrão -» quando uma varicvelale- [2 escada -se atório 2 tem T=0,0=0% 1 Função densidade de probabilidade: FatexA/gm. e 2/2 Aopriadades: curva Simélrica em torno da média 0 ; Pdeum evento é a área obatxo da curva é não tem solução analínico (tobelo) Pl2 <25)* Jóia et RUR ando ZE = Distribuição Norma? Geral -> avondo tem médio quatquer We var 02, FO€: Extade 4/VinoT. e trmni/iot Lei G.Nºs: média amostra > média pop qnd tomenho omostra T. Fraco: sequência de va.independentes identicam ente distribuídas, Com K= Elxil eVartud= tt co, q, P (JA Exr-ME)-0. Forte» seq-v.a. com ts Eli], sepando Elie) cos: um? (14 Bu amo a, pois dBi Teorema centraé do kmite: se n e sufentemente Ta distribuição cmostrot de. média 6) Seré agroy. nemae: Xe 14h fxim NL, 0270); ELXI= Hj vor cotin (os vero), 4 $ R-€69 , Kb ci) e BXcnM L, n(os) Rat Joia Iaot” Estimativa por intervalo 1)var 0! conhecida: construir um intervoto de confiança para o média H de uma pop. com O! conhecida e Supondo amostra de tamo nho nz= KH mtos; Placacb) - a ( talqpe Ocaca a q= -b pois distnormel CZE ésimétria)