







Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Os melhores documentos à venda: Trabalhos de alunos formados
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Comunidade
Peça ajuda à comunidade e tire suas dúvidas relacionadas ao estudo
Descubra as melhores universidades em seu país de acordo com os usuários da Docsity
Guias grátis
Baixe gratuitamente nossos guias de estudo, métodos para diminuir a ansiedade, dicas de TCC preparadas pelos professores da Docsity
Apresentação diferenciada das variáveis aleatórias discretas
Tipologia: Notas de estudo
1 / 13
Esta página não é visível na pré-visualização
Não perca as partes importantes!
Considere um experimento com espa¸co amostral Ω. Uma fun¸c˜ao definida no espa¸co Ω ´e uma vari´avel aleat´oria. Em outras palavras, imagine que s ∈ Ω seja um evento simples (um resultado em um expermento aleat´orio), uma vari´avel aleat´oria X ´e uma fun¸c˜ao que atribui um valor X(s) a este evento simples. Os valores que X assume podem ser tanto discretos quanto cont´ınuos, implicando em vari´aveis, respectivamente discretas ou cont´ınuas. Neste cap´ıtulo apenas nos preocuparemos com o caso discreto. Exemplo. Arremesso de uma Moeda Dez Vezes. Considere um experi- mento no qual arremessamos uma moeda dez vezes. O espa¸co amostral Ω deste experimento consiste em 2^10 = 1024 pontos (por exemplo, HHHHHHHHHH, HTHTHTHTHT, etc.... Lembrando que H=Cara e T=Coroa). Uma poss´ıvel vari´avel aleat´oria seria o n´umero de caras NH assim se s = HHHHT HT T T T , ent˜ao NH (s) = 5. Note que a fun¸c˜ao NH toma apenas valores discretos (por exemplo, 0, 1 , 2 , ...).
Lembremos que um modelo probabil´ıstico ´e determinado pela terna 〈Ω, F, P 〉, onde Ω ´e espa¸co amostral que representa o conjunto de poss´ıveis resultados para um experimento aleat´orio, F ´e a σ-´algebra que representa todos os poss´ıveis eventos compostos e P ´e a medida de probabilidade que atribui um valor entre 0 e 1 para cada evento, representado a chance de ocorrˆencia deste particular evento. A defini¸c˜ao da medida de probabilidade sobre o espa¸co amostral e, por conseq¨uˆencia, sobre todos os eventos compostos (por que?)^1 permite que
(^1) Revise a defini¸c˜ao a σ-´algebra. D´a para ver que todos eventos compostos s˜ao combina¸c˜oes de pontos do espa¸co amostral. Se vocˆe souber o valor das probabilidades para todos eventos simples, vocˆe tamb´em saber´a, pela simples aplica¸c˜ao das propriedades da probabildiade, seu
calculemos a fun¸c˜ao discreta de probabilidade para qualquer vari´avel aleat´oria X. Assim P (X = x) = P ({s : X(s) = x}). Em palavras, a probabilidade da vari´avel aleat´oria X possuir valor x ´e a probabilidade do evento composto de- scrito por {s : X(s) = x}, ou seja, ´e a probabilidade dos pontos do espa¸co amostral s nos quais a fun¸c˜ao X(s), que define a vari´avel aleat´oria, tem valor x. Para economizar s´ımbolos utilizaremos tamb´em P (x) significando a mesma coisa (note que estamos reservando letras ma´ıusculas para representar vari´aveis aleat´orias). Exemplo. Arremesso de uma Moeda Dez Vezes. Retornamos para o ex- emplo do experimento de arremesso de moeda dez vezes. Qual ´e a fun¸c˜ao de probabilidade para o n´umero de Caras em uma execu¸c˜ao do experimento? Os eventos de interesse s˜ao, porntanto, da forma {s : NH (s) = n}. Supondo que utilizamos uma moeda honesta e que os arremessos s˜ao independentes, temos que cada ponto do espa¸co amostral tem probabildidade de 1/ 210. Podemos usar an´alise combinat´oria para contarmos quantos pontos do espa¸co amostral correspondem a cada evento de interesse. Dado n, temos que escolher, n˜ao importando a ordem, n entre dez posi¸c˜oes na seq¨uˆencia de arremessos para in- serirmos Caras. Isso equivale a combina¸c˜oes de 10 elementos n a n, ou seja (^2) :
P (n) =
n
para n = 0, 1 , 2 , 3 , 4 ....
A rigor, uma distribui¸c˜ao de probabilidades ´e uma fun¸c˜ao crescente definida como F (x) = P (X ≤ x) para −∞ < x < ∞. Para o caso discreto utilizaremos o mesmo termo para se referir tamb´em a fun¸c˜ao discreta de probabilidade. Quando falarmos de vari´aveis aleat´orias cont´ınuas ficar´a mais clara a necessidade da no¸c˜ao de distribui¸c˜ao de probabilidade. Os modelos probabil´ısticos discretos s˜ao comumente definidos em termos de distribui¸c˜oes de probabilidade (aqui j´a estamos nos referindo
as fun¸c˜oes discre- tas de probabilidade), nas pr´oximas se¸c˜oes introduziremos v´arios deles e suas aplica¸c˜oes.
3.2 Modelo Uniforme
Suponha que desejamos descrever o simples experimento de lan¸camento de um dado honesto. A vari´avel aleat´oria de interesse ´e simplesmente o resultado do arremesso que chamaremos de X. Qual a distribui¸c˜ao de probabilidade apropri- ada para descrever este experiemnto? O espa¸co amostral ´e Ω = { 1 , 2 , 3 , 4 , 5 , 6 },
valor para qualquer evento composto. (^2) Se n˜ao lembra an´alise combinat´oria, recomendo fortemente, Iezzi, G. Matem´atica Ele- mentar, Vol. 5 - Combinat´oria.
(^0100 200 300 400 )
n
P(n)
Figura 3.2: Fun¸c˜ao de probabilidade geom´etrica com p = 0, 01.
amostral tem infinitos pontos, visto que h´a a possibilidade, infinitamente im- prov´avel, de que uma falha nunca ocorra. Probabilidades podem ser atribu´ıdas a cada seq¨uˆencia da seguinte forma: a cada utiliza¸c˜ao do sistema a probabili- dade de uma falha ´e p e a de funcionamento ´e 1 − p, assim, a probabilidade a ser atribu´ıda ao ponto do espa¸co amostral n ´e P (n) = (1 − p)n−^1 p (por que?)^3 , que ´e chamada distribui¸c˜ao geom´etrica. Distribui¸c˜ao geom´etrica.
P (n) = (1 − p)n−^1 p, (3.2)
onde n = 1, 2 , 3 , ....
3.4 Modelo Binomial
Suponha agora que queremos avaliar a probabilidade de em n lan¸camentos de uma moeda obtermos, n˜ao importando a ordem, k Caras. O espa¸co amostral ´e composto por todas as seq¨uˆencias poss´ıveis de comprimento n (por exemplo, se n = 4, Ω = {HHHH, HT HT, T T HH, ...}. Suponhamos que a probabilidade de obtermos uma Cara em um lan¸camento seja q (a moeda n˜ao precisa neces- sariamente ser honesta). Considerado os lan¸camentos independentes, podemos atribuir probabilidades para cada ponto do espa¸co amostral apenas contando o n´umero de Caras e Coroas. Procedendo dessa forma encontramos: qk(1 −q)n−k. Como a ordem n˜ao importa temos que utilizar an´alise combinat´oria para con- (^3) P (n) significa a probabilidade da primeira falha ocorrer na n-´esima utiliza¸c˜ao, ou seja, primeiro ocorrem n − 1 funcionamentos normais at´e que a seq¨uˆencia ´e encerrada com uma falha.
(^00 5 10 15 )
n
P(n)
Figura 3.3: Distribui¸c˜ao Binomial com q = 0, 5, n = 10 (tracejado) e n = 20. Note a simetria e a posi¸c˜ao da m´edia em p × n.
tarmos o n´umero de seq¨uˆencias equivalentes (com o mesmo n´umero de Caras, s´o que em outra ordem). No final obtemos: Distribui¸c˜ao Binomial.
P (k|n, p) =
n k
qk(1 − q)n−k^ (3.3)
para k = 0, 1 , 2 , 3 , 4 .... Qualquer evento independente cujo resultado possa ser classificado de apenas duas maneiras (erro ou acerto, sucesso ou falha, etc...) ´e denominado tentativa de Bernoulli. A distribui¸c˜ao do n´umero k de ocorrˆencias de uma das duas maneiras com probabilidade q em uma seq¨uˆencia de n tentativas de Bernoulli ´e Binomial P (k|n, p). Exemplo. Fornecimento de Energia. Suponha que n = 10 trabalhadores est˜ao utilizando energia el´etrica de forma intermitente. Estamos interessados em estimar a demanda total esperada. Como uma primeira aproxima¸c˜ao imagine que a qualquer momento cada trabalhador tem exatamente a mesma probabili- dade p de requerer uma unidade de potˆencia. Se considerarmos que os trabal- hadores atuam de forma independente teremos que a probabilidade de k deles demandarem energia simultaneamente ser´a binomial P (k|n, p). Se, em m´edia, um trabalhador utilizar energia 12 minutos por hora teremos que p = 1/5. Assim, a probabilidade de sete ou mais trabalhadores demandarem energia si- multˆaneamente ser´a P (7|10; 0, 2) + P (8|10; 0, 2) + P (9|10; 0, 2) + P (10|10; 0, 2) = 0 , 000864. Em outras palavras, se a potˆencia fornecida for suficiente para co- brir 6 trabalhadores simultaneamenente, haver´a sobrecarga com probabilidade 0 , 08%, ou seja em 1 minuto em 1157, ou ainda 1 minuto em 24 horas. Exemplo. Teste de Efic´acia de Medicamentos. A taxa normal de infec¸c˜ao
(^00 5 10 15 )
k
P(k|
λ)
Figura 3.5: Distribui¸c˜ao de Poisson com λ = 5 (tracejado) e λ = 10.
Distribui¸c˜ao de Poisson.
P (k|λ) =
λk k!
e−λ. (3.4)
Exemplo.Anivers´arios. Qual ´e achance que em um grupo de 500 pessoas 2 fa¸cam anivers´ario no dia 7 de setembro. Se as 500 pessoas forem escolhidas ao acaso podemos imaginar 500 tentativas de Bernoulli cada uma com probabili- dade q = 1/365. Pela defini¸c˜ao λ = nq = 500/365 = 1, 3699 ... A probabilidade que k pessoas fa¸cam anivers´ario exatamente no dia 7 de Setembro (ou em qual- quer dia escolhido) ´e P (k| 1 , 3699). Por exemplo, se k = 2, P (2| 1 , 3699) = 0, 24. Exemplo.Centen´arios. Ao nascer qualquer pessoa tem uma pequena chance de chegar aos 100 anos. Em uma comunidade grande o n´umero de nascimentos em um ano ´e grande. Devido a guerras, doen¸cas, etc... as dura¸c˜oes das vidas de uma mesma gera¸c˜ao n˜ao s˜ao independentes. No entanto, podemos comparar n nascimentos a n tentativas de Bernoulli com a vida ap´os os 100 anos como sucesso. Assim a probabilidade de k pessoas chegarem a 100 anos ´e P (k|λ), com λ dependendo do tamanho da popula¸c˜ao e das condi¸c˜oes de sa´ude.
Considere agora uma seq¨uˆencia de eventos aleat´orios ocorrendo no tempo, tais como desintegra¸c˜ao radioativa ou acessos a um web server. Suponha que os pontos sejam distribuidos em uma linha do tempo e que estejamos preocupados com sua distribui¸c˜ao (n´umero de pontos em um intervalo de tempo definido). Suponha adicionalmente que:
Quando estudarmos vari´aveis aleat´orias no cont´ınuo poderemos tratar este caso diretamente, por hora utilizaremos a id´eia de limite. Come¸camos por dividir uma unidade de tempo em um n´umero grande de intervalos n cada um com dura¸c˜ao 1/n. Cada intervalo ou est´a vazio (falha) ou cont´em no m´ınimo um ponto (sucesso). A probabilidade de sucesso pn ´e a mesma para qualquer um dos intervalos. A distribui¸c˜ao de probabilidade de k sucessos em n intervalos ´e, portanto, binomial P (k|n, pn). Note que o n´umero de sucessos n˜ao ´e o mesmo que o n´umero de pontos em um dado intervalo, visto que um sucesso pode representar mais de um ponto em um intervalo. Suponhamos ent˜ao adicional- mente que a probabilidade de dois pontos ou mais ocuparem o mesmo intervalo de tempo seja desprez´ıvel conforme n → ∞. Se fixarmos o n´umero m´edio de sucessos por unidade de tempo como λ = npn teremos que a probabilidade de k sucessos em uma unidade de tempo ter´a distribui¸c˜ao de Poisson P (k|λ). Nesta categoria se encaixam: n´umero de carros passando por um ped´agio por unidade de tempo; n´umero de erros de digita¸c˜ao em uma p´agina; n´umero de chamadas em um callcenter por unidade de tempo; etc...
3.6 Modelo Hipergeom´etrico
Suponha que em uma caixa h´a n bolas, n 1 vermelhas e n 2 = n − n 1 pretas. Retiramos da caixa r elementos sem reposi¸c˜ao. Qual ´e a probabilidade de que exatamente k deles sejam bolas vermelhas? O n´umero total de maneiras de
escolhermos r elementos dentre n ´e
n r
. Notemos que o grupo escolhido
tem k bolas vermelhas e r − k bolas pretas. As k bolas vermelhas podem ser
escolhidas de
n 1 k
formas. As r − k bolas pretas podem ser escolhidas de ( n − n 1 r − k
formas. Para cada escolha de bolas vermelhas pode-se escolher
uma das formas equivalentes de escolha das bolas pretas, assim multiplicamos as quantidades. Finalmente obtemos: Distribui¸c˜ao Hipergeom´etrica:
P (k|n, n 1 , r) =
n 1 k
n − n 1 r − k
n r
com k = 0, 1 , ..., min(r, n 1 ). Exemplo. Controle de Qualidade. Uma f´abrica produz pe¸cas que s˜ao em- baladas em caixas com 25 unidades. Para aceitar o lote enviado por essa f´abrica, o controle de qualidade de uma empresa procede da seguinte forma. Sorteia uma caixa do lote e, em seguida, sorteia cinco pe¸cas, sem reposi¸c˜ao, dessa mesma
(^00 10 20 30 40 )
Numero de fosforos no outro bolso (r)
ur
Figura 3.7: Caixa de F´osforos de Banach. Distribui¸c˜ao de f´osforos na caixa que ainda n˜ao est´a vazia. Cada caixa no come¸co tem exatos 50 f´osforos. Quando aquela que foi sorteada (bolso esquerdo ou bolso direito) se esvazia h´a exatos r f´osforos na outra caixa. Note que o mais prov´avel ´e que haja poucos f´osforos tamb´em na outra caixa. A probabilidade de haver at´e 15 f´osforos no outro bolso ´e de 92% (como calculo isso?)
para k = 0, 1 , 2 , 3 , 4 .... Exemplo. Caixa de F´osforos de Banach. Um matem´atico sempre carrega consigo uma caixa de f´osforos em seu bolso direito e uma em seu bolso esquerdo. Quando ele quer um f´osforo, ele escolhe um bolso ao acaso. A seq¨uˆencia de bol- sos ´e, portanto, uma seq¨uˆencia de tentativas de Bernoulli com p = 1/2. Suponha que cada caixa inicialmente contenha N f´osforos e considere o momento no qual nosso matem´atico descobre que uma das caixas est´a vazia. Neste mesmo mo- mento a outra caixa cont´em 0, 1 , 2 , ..., N f´osforos com probabilidade ur. Qual ´e essa probabilidade? Digamos que “sucesso”signifique escolher o bolso esquerdo. O bolso esquerdo estar´a vazio no momento em que o bolso direito contiver ex- atamente r f´osforos se, e somente se, exatametne N − r falhas (bolso direito) precederem o sucesso de n´umero N + 1. A probabilidade disso acontecer ser´a P (N − r|N + 1, 1 /2). A mesma coisa vale para o outro bolso assim:
ur = 2P (N − r|N + 1, 1 /2) =
2 N − r N
2 −^2 N^ +r.
3.8 Modelo Multinomial
A distribui¸c˜ao binomial pode ser generalizada para o caso de n tentativas inde- pendentes onde cada tentativa pode resultar em r diferentes resultados. Cada resultado Ei ocorre com probabilidade pi. Assim p 1 + p 2 + ... + pr = 1. A
(^10100 101 102 103 104 105 106 107 ) 0
101
102
103
104
105
106
107
108
Subroutines ordered by use frequency (n)
Number of uses
Linux reuse data SunOS reuse data Mac OS X reuse data
Figura 3.8: Distribui¸c˜ao de Zipf para reutiliza¸c˜ao de c´odigo nos sistemas Linux, MacOS e SunOS (referˆencias versus ranking). Esta figura foi extra´ıda de Veld- huizen,T.L., Software Libraries and Their Reuse: Entropy, Kolmogorov Com- plexit and Zipf’s Law, cs.SE/0508023.
probabilidade de que em n tentativas E 1 ocorra k 1 vezes, E 2 ocorra k 2 vezes e assim por diante ´e: Distribui¸c˜ao Multinomial.
P (k 1 , k 2 , ..., kr |p 1 , p 2 , ..., pr) =
n! k 1 !k 2 !...kr!
pk 11 pk 2 2 ...pk rr. (3.7)
com k 1 + k 2 + ... + kr = n. Exemplo.Jogando Doze Dados. Se jogarmos 12 dados, qual ´e a probabil- idade de obtermos cada face 2 vezes? Aqui E 1 ,...E 6 representam as seis faces dos dados. Queremos saber P (2, 2 , 2 , 2 , 2 , 2 | 1 / 6 , ..., 1 /6). Utilizando o modelo multinomial teremos (12!)(2)−^6 (6)−^12 = 0, 0034.
3.9 Distribui¸c˜ao de Zipf
A distribui¸c˜ao de Zipf ´e definida como: Distribui¸c˜ao de Zipf.
P (k|s, N ) =
k−s ∑N n=1 n −s
A distribui¸c˜ao de Zipf (tamb´em conhecida como lei de potˆencia) aparece nos lugares mais variados: nas palavras em uma l´ıngua, nas seq¨uˆencias de DNA,
a CPU ´e descrito por um modelo de Poisson com 4 requisi¸c˜oes a cada segundo. Essas requisi¸c˜oes podem ser de v´arias naturezas tais como: imprimir um arquivo, efetuar um c´alculo ou enviar uma mensagem pela internet, entre outras. (a) Escolhendo-se ao acaso um intervalo de 1 segundo, qual ´e a probabilidade de haver mais de 2 acessos A CPU? E do n´
umero de acessos ultrapassar 5? (b) considerando agora o intervalo de 10 segundos, tamb´em escolhido ao acaso, qual ´e a probabilidade de haver 50 acessos?3.11 Referˆencias
Se quiser fazer mais exerc´ıcios procure por (todos os exerc´ıcios do texto foram extra´ıdos de l´a):
Exemplos foram extra´ıdos de:
Livros de divulga¸c˜ao cient´ıfica relacionados `a lei de Zipf: