Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas

Modelos Discretos, Notas de estudo de Estatística

Apresentação diferenciada das variáveis aleatórias discretas

Tipologia: Notas de estudo

2012

Compartilhado em 21/06/2012

rodrigo-dim-1
rodrigo-dim-1 🇧🇷

2 documentos

1 / 13

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Cap´ıtulo 3
Modelos Discretos
3.1 Vari´aveis Aleat´orias Discretas
3.1.1 Vari´avel Aleat´oria
Considere um experimento com espa¸co amostral Ω. Uma fun¸ao definida no
espa¸co ´e uma vari´avel aleat´oria. Em outras palavras, imagine que s seja
um evento simples (um resultado em um expermento aleat´orio), uma vari´avel
aleat´oria X´e uma fun¸ao que atribui um valor X(s) a este evento simples. Os
valores que Xassume podem ser tanto discretos quanto cont´ınuos, implicando
em vari´aveis, respectivamente discretas ou cont´ınuas. Neste cap´ıtulo apenas nos
preocuparemos com o caso discreto.
Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi-
mento no qual arremessamos uma moeda dez vezes. O espa¸co amostral deste
experimento consiste em 210 = 1024 pontos (por exemplo, HHHHHHHHHH,
HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´ıvel
vari´avel aleat´oria seria o n´umero de caras NHassim se s=HH H HT H T T T T ,
ent˜ao NH(s) = 5. Note que a fun¸ao NHtoma apenas valores discretos (por
exemplo, 0,1,2, ...).
3.1.2 Fun¸ao discreta de probabilidade
Lembremos que um modelo probabil´ıstico ´e determinado pela terna h,F, P i,
onde ´e espa¸co amostral que representa o conjunto de poss´ıveis resultados para
um experimento aleat´orio, F´e a σalgebra que representa todos os poss´ıveis
eventos compostos e P´e a medida de probabilidade que atribui um valor entre
0 e 1 para cada evento, representado a chance de ocorrˆencia deste particular
evento. A defini¸ao da medida de probabilidade sobre o espa¸co amostral e,
por conseq¨encia, sobre todos os eventos compostos (por que?)1permite que
1Revise a defini¸ao a σalgebra. a para ver que todos eventos compostos ao combina¸oes
de pontos do espa¸co amostral. Se vocˆe souber o valor das probabilidades para todos eventos
simples, vocˆe tamb´em s aber´a, pela simples aplica¸ao das propriedades da pr obabildiade, seu
27
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Pré-visualização parcial do texto

Baixe Modelos Discretos e outras Notas de estudo em PDF para Estatística, somente na Docsity!

Cap´ıtulo 3

Modelos Discretos

3.1 Vari´aveis Aleat´orias Discretas

3.1.1 Vari´avel Aleat´oria

Considere um experimento com espa¸co amostral Ω. Uma fun¸c˜ao definida no espa¸co Ω ´e uma vari´avel aleat´oria. Em outras palavras, imagine que s ∈ Ω seja um evento simples (um resultado em um expermento aleat´orio), uma vari´avel aleat´oria X ´e uma fun¸c˜ao que atribui um valor X(s) a este evento simples. Os valores que X assume podem ser tanto discretos quanto cont´ınuos, implicando em vari´aveis, respectivamente discretas ou cont´ınuas. Neste cap´ıtulo apenas nos preocuparemos com o caso discreto. Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi- mento no qual arremessamos uma moeda dez vezes. O espa¸co amostral Ω deste experimento consiste em 2^10 = 1024 pontos (por exemplo, HHHHHHHHHH, HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´ıvel vari´avel aleat´oria seria o n´umero de caras NH assim se s = HHHHT HT T T T , ent˜ao NH (s) = 5. Note que a fun¸c˜ao NH toma apenas valores discretos (por exemplo, 0, 1 , 2 , ...).

3.1.2 Fun¸c˜ao discreta de probabilidade

Lembremos que um modelo probabil´ıstico ´e determinado pela terna 〈Ω, F, P 〉, onde Ω ´e espa¸co amostral que representa o conjunto de poss´ıveis resultados para um experimento aleat´orio, F ´e a σ-´algebra que representa todos os poss´ıveis eventos compostos e P ´e a medida de probabilidade que atribui um valor entre 0 e 1 para cada evento, representado a chance de ocorrˆencia deste particular evento. A defini¸c˜ao da medida de probabilidade sobre o espa¸co amostral e, por conseq¨uˆencia, sobre todos os eventos compostos (por que?)^1 permite que

(^1) Revise a defini¸c˜ao a σ-´algebra. D´a para ver que todos eventos compostos s˜ao combina¸c˜oes de pontos do espa¸co amostral. Se vocˆe souber o valor das probabilidades para todos eventos simples, vocˆe tamb´em saber´a, pela simples aplica¸c˜ao das propriedades da probabildiade, seu

28 CAP´ITULO 3. MODELOS DISCRETOS

calculemos a fun¸c˜ao discreta de probabilidade para qualquer vari´avel aleat´oria X. Assim P (X = x) = P ({s : X(s) = x}). Em palavras, a probabilidade da vari´avel aleat´oria X possuir valor x ´e a probabilidade do evento composto de- scrito por {s : X(s) = x}, ou seja, ´e a probabilidade dos pontos do espa¸co amostral s nos quais a fun¸c˜ao X(s), que define a vari´avel aleat´oria, tem valor x. Para economizar s´ımbolos utilizaremos tamb´em P (x) significando a mesma coisa (note que estamos reservando letras ma´ıusculas para representar vari´aveis aleat´orias). Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o ex- emplo do experimento de arremesso de moeda dez vezes. Qual ´e a fun¸c˜ao de probabilidade para o n´umero de Caras em uma execu¸c˜ao do experimento? Os eventos de interesse s˜ao, porntanto, da forma {s : NH (s) = n}. Supondo que utilizamos uma moeda honesta e que os arremessos s˜ao independentes, temos que cada ponto do espa¸co amostral tem probabildidade de 1/ 210. Podemos usar an´alise combinat´oria para contarmos quantos pontos do espa¸co amostral correspondem a cada evento de interesse. Dado n, temos que escolher, n˜ao importando a ordem, n entre dez posi¸c˜oes na seq¨uˆencia de arremessos para in- serirmos Caras. Isso equivale a combina¸c˜oes de 10 elementos n a n, ou seja (^2) :

P (n) =

n

para n = 0, 1 , 2 , 3 , 4 ....

3.1.3 Distribui¸c˜oes de Probabilidade

A rigor, uma distribui¸c˜ao de probabilidades ´e uma fun¸c˜ao crescente definida como F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremos o mesmo termo para se referir tamb´em a fun¸c˜ao discreta de probabilidade. Quando falarmos de vari´aveis aleat´orias cont´ınuas ficar´a mais clara a necessidade da no¸c˜ao de distribui¸c˜ao de probabilidade. Os modelos probabil´ısticos discretos s˜ao comumente definidos em termos de distribui¸c˜oes de probabilidade (aqui j´a estamos nos referindoas fun¸c˜oes discre- tas de probabilidade), nas pr´oximas se¸c˜oes introduziremos v´arios deles e suas aplica¸c˜oes.

3.2 Modelo Uniforme

Suponha que desejamos descrever o simples experimento de lan¸camento de um dado honesto. A vari´avel aleat´oria de interesse ´e simplesmente o resultado do arremesso que chamaremos de X. Qual a distribui¸c˜ao de probabilidade apropri- ada para descrever este experiemnto? O espa¸co amostral ´e Ω = { 1 , 2 , 3 , 4 , 5 , 6 },

valor para qualquer evento composto. (^2) Se n˜ao lembra an´alise combinat´oria, recomendo fortemente, Iezzi, G. Matem´atica Ele- mentar, Vol. 5 - Combinat´oria.

30 CAP´ITULO 3. MODELOS DISCRETOS

(^0100 200 300 400 )

n

P(n)

Figura 3.2: Fun¸c˜ao de probabilidade geom´etrica com p = 0, 01.

amostral tem infinitos pontos, visto que h´a a possibilidade, infinitamente im- prov´avel, de que uma falha nunca ocorra. Probabilidades podem ser atribu´ıdas a cada seq¨uˆencia da seguinte forma: a cada utiliza¸c˜ao do sistema a probabili- dade de uma falha ´e p e a de funcionamento ´e 1 − p, assim, a probabilidade a ser atribu´ıda ao ponto do espa¸co amostral n ´e P (n) = (1 − p)n−^1 p (por que?)^3 , que ´e chamada distribui¸c˜ao geom´etrica. Distribui¸c˜ao geom´etrica.

P (n) = (1 − p)n−^1 p, (3.2)

onde n = 1, 2 , 3 , ....

3.4 Modelo Binomial

Suponha agora que queremos avaliar a probabilidade de em n lan¸camentos de uma moeda obtermos, n˜ao importando a ordem, k Caras. O espa¸co amostral ´e composto por todas as seq¨uˆencias poss´ıveis de comprimento n (por exemplo, se n = 4, Ω = {HHHH, HT HT, T T HH, ...}. Suponhamos que a probabilidade de obtermos uma Cara em um lan¸camento seja q (a moeda n˜ao precisa neces- sariamente ser honesta). Considerado os lan¸camentos independentes, podemos atribuir probabilidades para cada ponto do espa¸co amostral apenas contando o n´umero de Caras e Coroas. Procedendo dessa forma encontramos: qk(1 −q)n−k. Como a ordem n˜ao importa temos que utilizar an´alise combinat´oria para con- (^3) P (n) significa a probabilidade da primeira falha ocorrer na n-´esima utiliza¸c˜ao, ou seja, primeiro ocorrem n − 1 funcionamentos normais at´e que a seq¨uˆencia ´e encerrada com uma falha.

3.4. MODELO BINOMIAL 31

(^00 5 10 15 )

n

P(n)

Figura 3.3: Distribui¸c˜ao Binomial com q = 0, 5, n = 10 (tracejado) e n = 20. Note a simetria e a posi¸c˜ao da m´edia em p × n.

tarmos o n´umero de seq¨uˆencias equivalentes (com o mesmo n´umero de Caras, s´o que em outra ordem). No final obtemos: Distribui¸c˜ao Binomial.

P (k|n, p) =

n k

qk(1 − q)n−k^ (3.3)

para k = 0, 1 , 2 , 3 , 4 .... Qualquer evento independente cujo resultado possa ser classificado de apenas duas maneiras (erro ou acerto, sucesso ou falha, etc...) ´e denominado tentativa de Bernoulli. A distribui¸c˜ao do n´umero k de ocorrˆencias de uma das duas maneiras com probabilidade q em uma seq¨uˆencia de n tentativas de Bernoulli ´e Binomial P (k|n, p). Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadores est˜ao utilizando energia el´etrica de forma intermitente. Estamos interessados em estimar a demanda total esperada. Como uma primeira aproxima¸c˜ao imagine que a qualquer momento cada trabalhador tem exatamente a mesma probabili- dade p de requerer uma unidade de potˆencia. Se considerarmos que os trabal- hadores atuam de forma independente teremos que a probabilidade de k deles demandarem energia simultaneamente ser´a binomial P (k|n, p). Se, em m´edia, um trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5. Assim, a probabilidade de sete ou mais trabalhadores demandarem energia si- multˆaneamente ser´a P (7|10; 0, 2) + P (8|10; 0, 2) + P (9|10; 0, 2) + P (10|10; 0, 2) = 0 , 000864. Em outras palavras, se a potˆencia fornecida for suficiente para co- brir 6 trabalhadores simultaneamenente, haver´a sobrecarga com probabilidade 0 , 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas. Exemplo. Teste de Efic´acia de Medicamentos. A taxa normal de infec¸c˜ao

3.5. MODELO POISSON 33

(^00 5 10 15 )

k

P(k|

λ)

Figura 3.5: Distribui¸c˜ao de Poisson com λ = 5 (tracejado) e λ = 10.

Distribui¸c˜ao de Poisson.

P (k|λ) =

λk k!

e−λ. (3.4)

Exemplo.Anivers´arios. Qual ´e achance que em um grupo de 500 pessoas 2 fa¸cam anivers´ario no dia 7 de setembro. Se as 500 pessoas forem escolhidas ao acaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabili- dade q = 1/365. Pela defini¸c˜ao λ = nq = 500/365 = 1, 3699 ... A probabilidade que k pessoas fa¸cam anivers´ario exatamente no dia 7 de Setembro (ou em qual- quer dia escolhido) ´e P (k| 1 , 3699). Por exemplo, se k = 2, P (2| 1 , 3699) = 0, 24. Exemplo.Centen´arios. Ao nascer qualquer pessoa tem uma pequena chance de chegar aos 100 anos. Em uma comunidade grande o n´umero de nascimentos em um ano ´e grande. Devido a guerras, doen¸cas, etc... as dura¸c˜oes das vidas de uma mesma gera¸c˜ao n˜ao s˜ao independentes. No entanto, podemos comparar n nascimentos a n tentativas de Bernoulli com a vida ap´os os 100 anos como sucesso. Assim a probabilidade de k pessoas chegarem a 100 anos ´e P (k|λ), com λ dependendo do tamanho da popula¸c˜ao e das condi¸c˜oes de sa´ude.

3.5.1 Distribui¸c˜ao de Poisson no tempo

Considere agora uma seq¨uˆencia de eventos aleat´orios ocorrendo no tempo, tais como desintegra¸c˜ao radioativa ou acessos a um web server. Suponha que os pontos sejam distribuidos em uma linha do tempo e que estejamos preocupados com sua distribui¸c˜ao (n´umero de pontos em um intervalo de tempo definido). Suponha adicionalmente que:

  1. As condi¸c˜oes do experimento permanecem constantes com o tempo;

34 CAP´ITULO 3. MODELOS DISCRETOS

  1. Intervalos de tempo que n˜ao se intersectam s˜ao estatisticamente indepen- dentes;

Quando estudarmos vari´aveis aleat´orias no cont´ınuo poderemos tratar este caso diretamente, por hora utilizaremos a id´eia de limite. Come¸camos por dividir uma unidade de tempo em um n´umero grande de intervalos n cada um com dura¸c˜ao 1/n. Cada intervalo ou est´a vazio (falha) ou cont´em no m´ınimo um ponto (sucesso). A probabilidade de sucesso pn ´e a mesma para qualquer um dos intervalos. A distribui¸c˜ao de probabilidade de k sucessos em n intervalos ´e, portanto, binomial P (k|n, pn). Note que o n´umero de sucessos n˜ao ´e o mesmo que o n´umero de pontos em um dado intervalo, visto que um sucesso pode representar mais de um ponto em um intervalo. Suponhamos ent˜ao adicional- mente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalo de tempo seja desprez´ıvel conforme n → ∞. Se fixarmos o n´umero m´edio de sucessos por unidade de tempo como λ = npn teremos que a probabilidade de k sucessos em uma unidade de tempo ter´a distribui¸c˜ao de Poisson P (k|λ). Nesta categoria se encaixam: n´umero de carros passando por um ped´agio por unidade de tempo; n´umero de erros de digita¸c˜ao em uma p´agina; n´umero de chamadas em um callcenter por unidade de tempo; etc...

3.6 Modelo Hipergeom´etrico

Suponha que em uma caixa h´a n bolas, n 1 vermelhas e n 2 = n − n 1 pretas. Retiramos da caixa r elementos sem reposi¸c˜ao. Qual ´e a probabilidade de que exatamente k deles sejam bolas vermelhas? O n´umero total de maneiras de

escolhermos r elementos dentre n ´e

n r

. Notemos que o grupo escolhido

tem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser

escolhidas de

n 1 k

formas. As r − k bolas pretas podem ser escolhidas de ( n − n 1 r − k

formas. Para cada escolha de bolas vermelhas pode-se escolher

uma das formas equivalentes de escolha das bolas pretas, assim multiplicamos as quantidades. Finalmente obtemos: Distribui¸c˜ao Hipergeom´etrica:

P (k|n, n 1 , r) =

n 1 k

n − n 1 r − k

n r

com k = 0, 1 , ..., min(r, n 1 ). Exemplo. Controle de Qualidade. Uma f´abrica produz pe¸cas que s˜ao em- baladas em caixas com 25 unidades. Para aceitar o lote enviado por essa f´abrica, o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, sorteia cinco pe¸cas, sem reposi¸c˜ao, dessa mesma

36 CAP´ITULO 3. MODELOS DISCRETOS

(^00 10 20 30 40 )

Numero de fosforos no outro bolso (r)

ur

Figura 3.7: Caixa de F´osforos de Banach. Distribui¸c˜ao de f´osforos na caixa que ainda n˜ao est´a vazia. Cada caixa no come¸co tem exatos 50 f´osforos. Quando aquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia h´a exatos r f´osforos na outra caixa. Note que o mais prov´avel ´e que haja poucos f´osforos tamb´em na outra caixa. A probabilidade de haver at´e 15 f´osforos no outro bolso ´e de 92% (como calculo isso?)

para k = 0, 1 , 2 , 3 , 4 .... Exemplo. Caixa de F´osforos de Banach. Um matem´atico sempre carrega consigo uma caixa de f´osforos em seu bolso direito e uma em seu bolso esquerdo. Quando ele quer um f´osforo, ele escolhe um bolso ao acaso. A seq¨uˆencia de bol- sos ´e, portanto, uma seq¨uˆencia de tentativas de Bernoulli com p = 1/2. Suponha que cada caixa inicialmente contenha N f´osforos e considere o momento no qual nosso matem´atico descobre que uma das caixas est´a vazia. Neste mesmo mo- mento a outra caixa cont´em 0, 1 , 2 , ..., N f´osforos com probabilidade ur. Qual ´e essa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo. O bolso esquerdo estar´a vazio no momento em que o bolso direito contiver ex- atamente r f´osforos se, e somente se, exatametne N − r falhas (bolso direito) precederem o sucesso de n´umero N + 1. A probabilidade disso acontecer ser´a P (N − r|N + 1, 1 /2). A mesma coisa vale para o outro bolso assim:

ur = 2P (N − r|N + 1, 1 /2) =

2 N − r N

2 −^2 N^ +r.

3.8 Modelo Multinomial

A distribui¸c˜ao binomial pode ser generalizada para o caso de n tentativas inde- pendentes onde cada tentativa pode resultar em r diferentes resultados. Cada resultado Ei ocorre com probabilidade pi. Assim p 1 + p 2 + ... + pr = 1. A

3.9. DISTRIBUIC¸ AO DE ZIPF˜ 37

(^10100 101 102 103 104 105 106 107 ) 0

101

102

103

104

105

106

107

108

Subroutines ordered by use frequency (n)

Number of uses

Linux reuse data SunOS reuse data Mac OS X reuse data

Figura 3.8: Distribui¸c˜ao de Zipf para reutiliza¸c˜ao de c´odigo nos sistemas Linux, MacOS e SunOS (referˆencias versus ranking). Esta figura foi extra´ıda de Veld- huizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Com- plexit and Zipf’s Law, cs.SE/0508023.

probabilidade de que em n tentativas E 1 ocorra k 1 vezes, E 2 ocorra k 2 vezes e assim por diante ´e: Distribui¸c˜ao Multinomial.

P (k 1 , k 2 , ..., kr |p 1 , p 2 , ..., pr) =

n! k 1 !k 2 !...kr!

pk 11 pk 2 2 ...pk rr. (3.7)

com k 1 + k 2 + ... + kr = n. Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual ´e a probabil- idade de obtermos cada face 2 vezes? Aqui E 1 ,...E 6 representam as seis faces dos dados. Queremos saber P (2, 2 , 2 , 2 , 2 , 2 | 1 / 6 , ..., 1 /6). Utilizando o modelo multinomial teremos (12!)(2)−^6 (6)−^12 = 0, 0034.

3.9 Distribui¸c˜ao de Zipf

A distribui¸c˜ao de Zipf ´e definida como: Distribui¸c˜ao de Zipf.

P (k|s, N ) =

k−s ∑N n=1 n −s

A distribui¸c˜ao de Zipf (tamb´em conhecida como lei de potˆencia) aparece nos lugares mais variados: nas palavras em uma l´ıngua, nas seq¨uˆencias de DNA,

3.11. REFER ENCIASˆ 39

  1. No estudo de desempenho de uma central de computa¸c˜ao, o acesso a CPU ´e descrito por um modelo de Poisson com 4 requisi¸c˜oes a cada segundo. Essas requisi¸c˜oes podem ser de v´arias naturezas tais como: imprimir um arquivo, efetuar um c´alculo ou enviar uma mensagem pela internet, entre outras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual ´e a probabilidade de haver mais de 2 acessos A CPU? E do n´ umero de acessos ultrapassar 5? (b) considerando agora o intervalo de 10 segundos, tamb´em escolhido ao acaso, qual ´e a probabilidade de haver 50 acessos?
  2. Um livreiro descuidado mistura 4 exemplares defeituosos junto com out- ros 16 perfeitos de um certo livro did´atico. Quatro amigas v˜ao a essa livraria para comprar seus livros escolares. (a) Calcule a probabilidade de 3 levarem livros defeituosos. (b) Qual ´e a probabilidade de, ap´os a visita dessas meninas,restarem o mesmo n´umero de defeituosso na livraria? E de n˜ao restar nenhum?
  3. Uma vacina contra a gripe ´e eficiente em 70% dos casos. Sorteamos, ao acaso, 20 dos pacientes vacinados e pergunta-se a probabilidade de obter: (a) Pelo menos 18 imunizados. (b) No m´aximo 4 imunizados. (c) N˜ao mais do que 3 n˜ao imunizados.
  4. Uma linha de produ¸c˜ao est´a sendo analisada para efeito de controle da qualidade das pe¸cas produzidas. Tendo em vista o alto padr˜ao requerido, a produ¸c˜ao ´e interrompida para regulagem toda vez que uma pe¸ca defeituosa ´e observada. Se 0,01 ´e a probabilidade da pe¸ca ser defeituosa, estude o comportamento da vari´avel Q, quantidade de pe¸cas boas produzidas antes da primeira defeituosa.

3.11 Referˆencias

Se quiser fazer mais exerc´ıcios procure por (todos os exerc´ıcios do texto foram extra´ıdos de l´a):

  • Magalh˜aes M.N., de Lima A.C.P., No¸c˜oes de Probabilidade e Estat´ıstica, Edusp,2004.

Exemplos foram extra´ıdos de:

  • Feller, W. An introduction to Probability Theory and Its Applications, Volume I, John Wiley & Sons, 1950.
  • DeGroot, M., Probability and Statistics, Addison-Wesley, 1975.

Livros de divulga¸c˜ao cient´ıfica relacionados `a lei de Zipf:

  • Bak, P., How Nature Works, Oxford University Press, 1996.
  • Buchanan, M., Ubiquity, Crown Publishers, 2001.