Conceitos Iniciais
Antes de introduzir o significado de passeio aleatório, parece prudente desenvolver alguns conceitos essenciais para a teoria da probabilidade. Esta seção se preocupa em apresentar apenas o necessário sobre variáveis aleatórias e processos estocásticos. Espero que ao longo do texto criemos familiaridade com as notações matemáticas.
Variável Aleatória
Frequentemente, quando um experimento probabilístico é realizado, estamos interessados em uma função definida sobre o resultado ao invés do resultado propriamente dito. Por exemplo, suponha o lançamento simultâneo de dois dados. Nessa situação é normal que a atenção se volte para a soma resultante do lançamento e não para cada dado separadamente. Imagine que estejamos prestes a vencer um jogo de tabuleiro e que para isso precisemos avançar exatamente \(9\) casas. O interesse em saber se a soma dos dados será igual a \(9\) é muito maior que o interesse acerca dos possíveis pares de resultado: \((3,6), (4,5), (5,4)\) ou \((6,3)\).
Funções que abstraem os possíveis resultados de um experimento probabilístico e os mapeiam a uma quantidade de interesse são conhecidas como variáveis aleatórias.
Mais um exemplo
Considere um jogo constituído de dois lançamentos independentes de uma moeda enviesada que costuma resultar cara \((C)\) com \(4\) vezes mais frequência que coroa \((R)\). Pretende-se tomar algumas decisões com base no resultado:
- Se \(2\) caras, o jogador permanecerá no jogo;
- Se faces distintas, o jogador sofrerá uma penalidade;
- Se \(2\) coroas, o jogador será desclassificado.
Modelando os resultados através de uma árvore de possibilidades, obtemos:
A árvore de possibilidades possui \(2\) níveis, cada um representando o lançamento de uma das moedas. Como os lançamentos são limitados a cara ou coroa, cada nó não-folha gera \(2\) novos ramos. No fim, o problema se resume a \(4\) possíveis sequências: \(CC,CR,RC\) e \(RR\), constituindo o espaço amostral \(S\).
Sabendo que os lançamentos individuais são indepententes, deduzimos que partindo da raiz, a probabilidade de alcançar uma folha deve ser igual a multiplicação das probabilidades dos ramos percorridos.
Resultado | Probabilidade |
\(CC\) | $$\frac{4}{5} \times \frac{4}{5} = \frac{16}{25}$$ |
\(CR\) | $$\frac{4}{5} \times \frac{1}{5} = \frac{4}{25}$$ |
\(RC\) | $$\frac{1}{5} \times \frac{4}{5} = \frac{4}{25}$$ |
\(RR\) | $$\frac{1}{5} \times \frac{1}{5} = \frac{1}{25}$$ |
Definir uma variável aleatória da forma \(X =\) "número de coroas obtidas nos dois lançamentos de moeda" significa gerar o mapeamento:
$$P(X=0) = P(\{CC\}) = \frac{16}{25}$$ $$P(X=1) = P(\{CR,RC\}) = \frac{4}{25}+\frac{4}{25}=\frac{8}{25}$$ $$P(X=2) = P(\{RR\}) = \frac{1}{25}$$
\(P(X=x)\) no geral lê-se: probabilidade de que a variável aleatória \(X\) assuma o valor \(x\).
Neste caso, se nos for perguntado qual a probabilidade de que o jogador sofra uma penalidade como consequência do lançamento das duas moedas, reponderíamos que é a mesma probabilidade de se obter \(1\) coroa, ou seja, \(P(X=1)=8/25\).
Uma função \(X\) definida sobre o espaço amostral \(S\) e que mapeia à valores num conjunto enumerável de pontos é denominada variável aleatória discreta.
Processo Estocástico
Uma van universitária que transporta estudantes entre os dormitórios e a reitoria chega à parada mais próxima dos dormitórios em intervalos regulares de tempo. O veículo sempre chega vazio, mas se limita a acomodar no máximo \(6\) passageiros. Por coincidência, \(6\) também é a quantidade de assentos disponíveis para uso no ponto de espera. Uma vez que todos os assentos do ponto estejam ocupados, as pessoas excedentes aguardam a chegada da van em pé.
- Se no momento da chegada da van houver \(6\) pessoas ou menos na fila, ela parte levando todos e deixa o ponto vazio;
- Por outro lado, se houver mais de \(6\) pessoas na fila, o motorista permite que apenas aquelas sentadas nos assentos embarquem. As restantes devem esperar pela próxima viagem.
Atendendo às reclamações do corpo discente quanto à infraestrutura insuficiente do ponto de espera, os gestores de mobilidade urbana propuseram a condução de um estudo.
Decidiram tratar este problema como um processo estocástico, onde a variável de interesse é o número de assentos ainda ocupados no ponto após a partida de uma van. Dependendo do horário, a probabilidade de que o ponto permaneça mais vazio ou mais ocupado pode variar porque, naturalmente, a chegada de pessoas à fila possui caráter aleatório. Dizemos que este problema é um processo estocástico de tempo discreto e estado discreto.
Tempo
O conjunto de índices que evidencia a evolução do processo geralmente é referido como tempo. Esta representação pode ser dada pela passagem contínua do tempo, ou pela contagem de unidades discretas. Há ainda os casos em que os índices são uma abstração do tempo através da contagem de acontecimentos regulares.
No nosso exemplo, o tempo é dado pelas chegadas sucessivas das vans. O índice desse processo assume valores no conjunto dos números naturais, \(t=1,2,3,\text{...}\)
Estado
Os valores que a variável de interesse pode assumir constituem o espaço de estados do processo. A ocorrência de cada estado está associada a uma probabilidade que evolui ao longo do tempo.
No nosso exemplo, a variável de interesse pode assumir valores em \(\{0,1,2,3,4,5,6\}\), sendo a quantidade de assentos ocupados no ponto.
Interpretando realizações e probabilidades
A figura abaixo ilustra uma realização particular do processo estocástico modelado pelo estudo.
No esquema mais acima estão representadas as contagens de assentos ocupados que foram observadas após cada uma das \(9\) primeiras viagens feitas em um dia. No esquema mais abaixo, apontado por setas, está a probabilidade de que após a partida da \(t\)-ésima van, aquela quantidade de assentos ocupados fosse observada.
- Neste dia em específico, quando a \(2ª\) van partiu, todos os estudantes embarcaram e portanto nenhum assento do ponto de espera permaneceu ocupado. A probabilidade de que isso aconteça é denotada pela expressão \(P(X_2=0)\).
- Vemos através da distribuição de \(X_2\) que é mais provável que o ponto fique vazio após a partida da \(2º\) van.
- Ainda neste mesmo dia, quando a \(5ª\) van partiu, \(3\) pessoas foram deixadas para trás e por isso \(3\) assentos do ponto permaneceram ocupados. A probabilidade de que isso aconteça é dada por \(P(X_5=3)\).
- Pela distribuição de \(X_5\) vemos que é pouco provável que o ponto fique completamente vazio ou completamente ocupado após a partida da \(5ª\) van.
- Finalmente, depois que a \(8ª\) van partiu, o ponto se manteve com todos os assentos ocupados. A situação se repete após a partida da \(9ª\) van.
- Através da distribuição de probabilidade de \(X_8\) percebemos que a lotação do ponto neste instante é algo recorrente e exige maiores investigações.
Essas informações são úteis para identificar a lotação do ponto, mas além das \(6\) pessoas nos assentos, quantas ainda tiveram que continuar esperando em pé? Será que vale a pena aumentar a frota de vans ou melhorar a infraestrutura do ponto? Por que uma quantidade maior de pessoas chegam ao ponto em horários específicos? Talvez os gestores tenham que conduzir estudos complementares.
Um processo estocástico \(\{ X_t \text{, } t \in T \}\) é definido como uma sequência de variáveis aleatórias indexadas por um conjunto ordenado de índices.
Processos estocásticos têm aplicação em diversas áreas do conhecimento como biologia, física e teoria da informação, mas não entraremos neste nível de especificidade. A partir de agora nos contentaremos em discutir uma categoria mais genérica deste conceito: o passeio aleatório.
Passeio Aleatório
Uma forma irreverente de descrever o passeio aleatório se dá através do andar de um bêbado. Imagine que os movimentos dessa pessoa são de certo modo imprevisíveis e que consistem de simples passos. Sempre após uma unidade de tempo é dado um passo: podendo ser para frente, com probabilidade \(p\); ou para trás, com probabilidade \(1-p\).
A fim de simplificar o problema assumiremos que \(p=1/2\), ou seja, trataremos de um passeio aleatório simétrico. Assumiremos também que o problema é unidimensional, visto que não haverá outros graus de liberdade para o movimento.
Definimos então uma variável aleatória \(Y=\) "sentido do passo (frente \(=+1\), trás\(=-1\))", cujas probabilidades são:
- $$P(Y=+1) = p = \frac{1}{2}$$
- $$P(Y=-1) = 1-p = \frac{1}{2}$$
Em seguida indexamos \(Y\) utilizando um inteiro não negativo \(k\) para identificar o \(k\)-ésimo passo realizado. Sob a persepectiva de um passeio aleatório composto de \(t\) passos independentes, denotamos:
- \(Y_1\) como sendo o sentido do \(1º\) passo;
- \(Y_2\) como o sentido do \(2º\) passo;
... - \(Y_t\) como o sentido do \(t\)-ésimo e último passo.
Cada um dos passos aleatórios \(Y_k\) contribuirão da sua forma para o cálculo da posição final.
Posição Final
A posição final é uma das diversas variáveis passíveis de análise em um passeio aleatório. Partindo da posição inicial \(0\) na reta real, a posição final \(X_t\) será obtida por meio da soma dos \(t\) passos realizados. Passos à frente contribuem em \(1\) para o somatório, enquanto passos para trás contribuem com \(-1\).
$$X_t=\sum_{k=1}^tY_k$$
Revisitando o conceito de realização apresentado na seção anterior, chamaremos de caminho uma realização particular do passeio aleatório. Uma vez que o sentido tomado por cada passo é independente e equiprovável, deduzimos que a probabilidade de ocorrência de um caminho com \(t\) passos é igual a \((1/2)^t\).
$$P(X_6=-2)=\text{?}$$
Por exemplo, o caminho de \(6\) passos ilustrado acima tem probabilidade \((1/2)^6\) de acontecer. E mesmo que sua posição final seja igual a \(-2\), atentemos que
$$P(X_6=-2)\neq\Big(\frac{1}{2}\Big)^6$$
pois existem outros caminhos de \(6\) passos que se encerram na posição \(-2\). Como encontrar todos eles?
Para ir adiante com esse problema retrocederemos um pouco na complexidade e analisaremos um passeio aleatório de apenas \(3\) passos.
Analisando os caminhos possíveis
Qual a probabilidade de que, partindo da posição inicial \(0\), se esteja na posição \(3\) com exatos \(3\) passos? Essa é simples. Se trata do caso especial onde todos os passos são dados à frente: \(Y_1=Y_2=Y_3=+1\). Não existe nenhum outro caminho que satisfaça essas condições. Logo,
$$P(X_3=3)=1 \times \Big(\frac{1}{2}\Big)^3 =\frac{1}{8}$$
E qual a probabilidade de que esteja na posição \(-1\) com exatos \(3\) passos? É díficil responder de imediato, porém já temos pistas o suficiente para desconfiar que a resposta deve ser algo da forma:
$$P(X_3=-1)= \text{?}\times \Big(\frac{1}{2}\Big)^3 = \frac{\text{?}}{8}$$
onde \(\text{(?)}\) deve ser substituído por um inteiro positivo que represente a quantidade de caminhos possíveis com \(3\) passos que se encerram na posição \(-1\). Por isso vamos construir o raciocínio por partes.
Caminhos com 1 passo
- Existem apenas \(2^1\) caminhos possíveis com \(t=1\) passo;
- Cada um deles têm probabilidade \((1/2)^1\);
- E a variável posição final \(X_1\) toma valores em \(\{-1,1\}\).
Caminhos com 2 passos
- Existem \(2^2\) caminhos possíveis com \(t=2\) passos;
- Cada um deles têm probabilidade \((1/2)^2\);
- E a variável posição final \(X_2\) toma valores em \(\{-2,0,2\}\).
Caminhos com 3 passos
- Existem \(2^3\) caminhos possíveis com \(t=3\) passos;
- Cada um deles têm probabilidade \((1/2)^3\);
- E a variável posição final \(X_3\) toma valores em \(\{-3,-1,1,3\}\).
Já temos o que é preciso para responder a questão levantada, basta identificar quantos dos caminhos acima têm posição final igual a \(-1\). À propósito os caminhos são \([+1,-1,-1]\), \([-1,+1,-1]\) e \([-1,-1,+1]\), sendo \(3\) de um total de \(8\). Logo,
$$P(X_3=-1)=3\times \Big(\frac{1}{2}\Big)^3=\frac{3}{8}$$
Caminhos com 4 passos
Se prosseguíssemos com a análise iríamos descobrir que quando \(t=4\) passos:
- Existem \(2^4\) caminhos possíveis;
- Cada um deles têm probabilidade \((1/2)^4\);
- E a variável posição final \(X_4\) toma valores em \(\{-4,-2,0,2,4\}\).
Aos poucos vem ficando evidente que existe um padrão guiando a análise dos caminhos. Na verdade, todas as informações levantadas possuem algum grau de relação com o número de passos \(t\):
- A quantidade de caminhos possíveis é dada por \(2^t\);
- Cada um deles têm probabilidade \((1/2)^t\), ou seja, são equiprováveis;
- A variável posição final \(X_t\) toma valores no conjunto simétrico \(\{-t,-t+2,-t+4,\text{...},t\}\).
- E para calcular \(P(X_t=x)\) é necessário contar, dentre todos os \(2^t\) caminhos possíveis, quantos possuem posição final igual a \(x\).
Felizmente, graças ao gradioso matemático francês Blaise Pascal, somos poupados de continuar contando caminhos exaustivamente. Podemos utilizar de um curioso arranjo triangular de números para generalizar de uma vez por todas este problema. Estamos falando do triângulo de Pascal.
Triângulo de Pascal
O triângulo de Pascal é uma abordagem sistemática e generalista de contar as maneiras possíveis de selecionar um subconjunto de elementos a partir de uma coleção. A figura abaixo ilustra os \(4\) primeiros níveis do triângulo.
É possível estender a quantidade de níveis iterativamente. Para isso basta seguir o procedimento de somar os números das diagonais ligeiramente acima. Por exemplo, as setas azuis na figura indicam como o conteúdo do nível \(4\) foi obtido a partir do nível \(3\). Caso um dos elementos diagonais não existam no nível acima, como acontece nas bordas do triângulo, então assume-se contribuição \(0\) para a soma.
Se desejar, confirme que o nível \(t=5\) deve ser composto pelos números \(1,5,10,10,5,1\).
Amarrando o triângulo ao passeio
As seguintes associações são válidas entre o triângulo e o passeio aleatório simétrico:
- O nível \(t\) do triângulo corresponde a quantidade de passos \(t\) do passeio aleatório;
- A soma dos números do nível \(t\) do triângulo corresponde à quantidade total de caminhos possíveis \(2^t\);
- A quantidade de números do nível \(t\) corresponde à quantidade de posições finais alcançáveis com \(t\) passos;
- Um número do nível \(t\) corresponde à contagem de caminhos possíveis de uma das posições finais alcançáveis com \(t\) passos. O mapeamento é feito em ordem.
Talvez fique mais intuitivo em um desenho. Vamos validar essas associações revisitando alguns exemplos:
Com este procedimento é possível encontrar a distribuição de probabilidade da variável aleatória posição final \(X_t\) para qualquer que seja a quantidade de passos \(t\) definida.
Essa é a metodologia utilizada para encontrar as probabilidades teóricas da simulação!
Distribuições de Probabilidade
Até agora calculamos apenas probabilidades pontuais: especificando a quantidade de passos e a posição final desejada. Mas podemos, pensando de forma mais ampla, ter interesse em obter as probabilidades de todas as posições finais alcançáveis com \(t\) passos. Como proceder nessa situação? Basta repetir o procedimento da seção anterior utilizando cada número do nível \(t\) do triângulo.
Revisitando o exemplo onde \(t=6\) passos:
Acabamos de obter a distribuição de probabilidade da variável aleatória \(X_6\).
A distribuição de probabilidade de uma variável aleatória descreve como as probabilidades estão distribuídas sobre todos os valores os quais é possível assumir. No contexto de uma variável aleatória discreta, uma distribuição é considerada válida se:
- Todas as probabilidades são números reais não negativos;
- A soma das probabilidades é igual a \(1\).
A sequência de figuras abaixo apresenta a distribuição de probabilidade da posição final para diferentes números de passos.
Perceba a simetria ao redor da posição inicial \(0\).
A sequência de variáveis aleatórias que modelam a posição final de um passeio aleatório \(\{X_t, t=1,2,3\text{...}\}\) é um processo estocástico. A quantidade de passos \(t\) é dita ser o tempo do processo, e a união de todas posições finais alcançáveis constituem o espaço de estados.
Sobre a Simulação
Esta é uma seção extra que cobre alguns pontos específicos sobre o funcionamento da simulação. Se você tem dúvidas quanto à utilização dos controles ou quer descobrir o porquê da frequência relativa se aproximar da probabilidade teórica, então as respostas estão aqui.
Controles
O gerenciamento sobre a simulação é mantido através de dois grupos de controle: os controles de criação e os controles de execução. Alterações nas configurações de criação iniciam automaticamente uma nova simulação com base no novo contexto de passos e caminhos. Por outro lado, interagir com os controles de execução interfere no comportamento da simulação em andamento.
Controles de criação
Passos
Designa a quantidade de passos a serem percorridos pelo passeio. Possui valor default igual a \(10\), mas pode assumir qualquer valor inteiro no intervalo \([1,30]\).
Caminhos
Designa a quantidade de caminhos a serem gerados aleatoriamente. Possui valor default igual a \(10\), mas pode assumir qualquer um dos valores em \(\{10, 50, 100, 200, 500, 1000\}\).
Controles de execução
Play/Pause
Interrompe/retoma a execução da simulação.
Desacelerar
Diminui a velocidade de execução da simulação por um fator de \(0.5\).
Acelerar
Aumenta a velocidade de execução da simulação por um fator de \(2\).
Reiniciar simulação
Reinicia a simulação utilizando os mesmos dados que a trouxe até o estado atual de execução.
Nova simulação
Inicia uma nova simulação através da geração aleatória de novos caminhos.
Frequência Relativa
Pode-se dizer que o propósito da simulação se resume a acompanhar a frequência relativa se aproximar da probabilidade teórica.
A cada novo caminho aleatório gerado, a atenção se volta à posição final alcançada. Tanto isso é verdade que o gráfico mais à esquerda explicita o valor da posição final sempre que um novo caminho é traçado.
Por trás dos panos a simulação mantém variáveis contadoras para armazenar quantas vezes cada posição final foi observada. Estas variáveis representam a frequência absoluta \(f_a\) destas posições. Sempre ao iniciar uma nova simulação, as contagens são zeradas.
A frequência relativa \(f_r\), por sua vez, é definida como a relação entre a frequência absoluta e o número total de observações \(n\). No contexto do passeio, \(n\) é dado pela quantidade de caminhos aleatórios já gerados pela simulação.
$$f_r=\frac{f_a}{n}$$
Por exemplo, vejamos a evolução da frequência relativa ao longo da simulação de \(50\) caminhos aleatórios compostos por \(6\) passos:
Posição final | \(f_a\) | \(f_r\) |
\(-6\) | \(0\) | \(0\) |
\(-4\) | \(0\) | \(0\) |
\(-2\) | \(0\) | \(0\) |
\(0\) | \(1\) | \(1\) |
\(2\) | \(0\) | \(0\) |
\(4\) | \(0\) | \(0\) |
\(6\) | \(0\) | \(0\) | Total: | \(1\) | \(1\) |
Posição final | \(f_a\) | \(f_r\) |
\(-6\) | \(0\) | \(0\) |
\(-4\) | \(0\) | \(0\) |
\(-2\) | \(1\) | \(0.2\) |
\(0\) | \(3\) | \(0.6\) |
\(2\) | \(1\) | \(0.2\) |
\(4\) | \(0\) | \(0\) |
\(6\) | \(0\) | \(0\) | Total: | \(5\) | \(1\) |
Posição final | \(f_a\) | \(f_r\) |
\(-6\) | \(0\) | \(0\) |
\(-4\) | \(5\) | \(0.1\) |
\(-2\) | \(11\) | \(0.22\) |
\(0\) | \(12\) | \(0.24\) |
\(2\) | \(17\) | \(0.34\) |
\(4\) | \(3\) | \(0.06\) |
\(6\) | \(2\) | \(0.04\) | Total: | \(50\) | \(1\) |
Mesmo simulando apenas \(50\) caminhos já é possível identificar certa acomodação das frequências relativas próximo às probabilidades da distribuição. Quando maior a quantidade de caminhos aleatórios gerados, mais nítido se torna o processo de convergência. Esse é o cerne da lei dos grandes números.
Lei dos Grandes Números
Nem sempre um problema probabilístico é facilmente modelável como fizemos com a variável posição final do passeio aleatório simétrico unidimensional. Às vezes a melhor estimativa da probabilidade derivada da frequência relativa obtida pela repetição sucessida de um experimento.
É por meio da lei dos grandes números que o conceito frequencista de probabilidade se relaciona com a probabilidade teórica clássica.
Bernoulli formulou que para um grande número de experiências, tendo cada qual um resultado aleatório, a frequência relativa de cada um desses resultados tende a estabilizar e convergir para um valor que constitui sua probabilidade. É somente no limite em que infinitas repetições forem realizadas, que ambos os conceitos se tornarão exatamente equivalentes.
$$p=\lim_{n\to\infty} f_r = \lim_{n\to\infty}\frac{f_a}{n}$$
Isto significa que o propósito de "acompanhar a frequência relativa se aproximar da probabilidade teórica" traduz-se aqui como "pôr a lei dos grandes números à prova". Muito porque já deduzimos como se dão as distribuições de probabilidade. Só queremos ter a satisfação de visualizar que aquilo obtido via teoria, de fato modela o experimento na prática.