Distribuição Zipf


As distribuições Zipf são usadas para amostrar dados com base na lei de Zipf.

Lei de Zipf: Em uma coleção, o enésimo termo comum é 1/n vezes o termo mais comum. Por exemplo, a 5ª palavra comum em inglês ocorre quase 1/5 da palavra mais usada.

Tem dois parâmetros:

a - parâmetro de distribuição.

size - A forma da matriz retornada.

Exemplo

Desenhe uma amostra para distribuição zipf com parâmetro de distribuição 2 com tamanho 2x3:

from numpy import random

x = random.zipf(a=2, size=(2, 3))

print(x)

Visualização da Distribuição Zipf

Exemplo de 1000 pontos, mas plotando apenas aqueles com valor < 10 para um gráfico mais significativo.

Exemplo

from numpy import random
import matplotlib.pyplot as plt
import seaborn as sns

x = random.zipf(a=2, size=1000)
sns.distplot(x[x<10], kde=False)

plt.show()

Resultado