Distribuição Zipf
As distribuições Zipf são usadas para amostrar dados com base na lei de Zipf.
Lei de Zipf: Em uma coleção, o enésimo termo comum é 1/n vezes o termo mais comum. Por exemplo, a 5ª palavra comum em inglês ocorre quase 1/5 da palavra mais usada.
Tem dois parâmetros:
a
- parâmetro de distribuição.
size
- A forma da matriz retornada.
Exemplo
Desenhe uma amostra para distribuição zipf com parâmetro de distribuição 2 com tamanho 2x3:
from numpy import random
x = random.zipf(a=2, size=(2, 3))
print(x)
Visualização da Distribuição Zipf
Exemplo de 1000 pontos, mas plotando apenas aqueles com valor < 10 para um gráfico mais significativo.
Exemplo
from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns
x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)
plt.show()