PyTorch で二項分布を扱う：torch.distributions.binomial.Binomial の使い方

2024-04-04

PyTorch の確率分布における二項分布：torch.distributions.binomial.Binomial

PyTorch の torch.distributions モジュールは、確率分布を扱うための便利なツールを提供しています。その中でも torch.distributions.binomial.Binomial は、二項分布を扱うためのクラスです。

二項分布とは

二項分布は、n回のコイン投げでk回表が出る確率を表す離散確率分布です。試行回数nと成功確率pが決まれば、二項分布のパラメータが定まります。

torch.distributions.binomial.Binomial クラスは、以下のコンストラクタで初期化できます。

torch.distributions.binomial.Binomial(total_count, probs)

total_count: 試行回数
probs: 成功確率

例

以下のコードは、10回のコイン投げで3回表が出る確率を計算します。

import torch

# 試行回数
total_count = torch.tensor(10)

# 成功確率
probs = torch.tensor(0.5)

# 二項分布
binomial = torch.distributions.binomial.Binomial(total_count, probs)

# 確率
p = binomial.log_prob(torch.tensor(3))

print(p)

出力

-1.3862944

torch.distributions.binomial.Binomial クラスは、様々なメソッドを提供しています。詳細はドキュメントを参照してください。
PyTorch のチュートリアルでは、確率分布に関する様々な例が紹介されています。

PyTorch の torch.distributions.binomial.Binomial クラスは、二項分布を扱うための便利なツールです。試行回数と成功確率を指定することで、二項分布に基づく確率やサンプリングを行うことができます。

PyTorch Binomial サンプルコード

確率計算

import torch

# 試行回数
total_count = torch.tensor(10)

# 成功確率
probs = torch.tensor(0.5)

# 二項分布
binomial = torch.distributions.binomial.Binomial(total_count, probs)

# 3回表が出る確率
p3 = binomial.log_prob(torch.tensor(3))

# 4回表が出る確率
p4 = binomial.log_prob(torch.tensor(4))

print(f"3回表: {p3}")
print(f"4回表: {p4}")

サンプリング

# 試行回数
total_count = torch.tensor(10)

# 成功確率
probs = torch.tensor(0.5)

# 二項分布
binomial = torch.distributions.binomial.Binomial(total_count, probs)

# 10個のサンプル
samples = binomial.sample((10,))

print(samples)

事後分布

import torch

# 試行回数
total_count = torch.tensor(10)

# 事前分布
prior = torch.distributions.uniform.Uniform(torch.tensor(0.), torch.tensor(1.))

# データ
data = torch.tensor([3, 4, 5])

# 尤度
likelihood = torch.distributions.binomial.Binomial(total_count, prior)

# 事後分布
posterior = torch.distributions.kl.kl_divergence(likelihood, prior)

print(posterior)

ベイズ推論

import torch
from pyro.infer import MCMC

# 試行回数
total_count = torch.tensor(10)

# データ
data = torch.tensor([3, 4, 5])

# モデル
def model(total_count, data):
    probs = pyro.sample("probs", torch.distributions.uniform.Uniform(torch.tensor(0.), torch.tensor(1.)))
    return torch.distributions.binomial.Binomial(total_count, probs).log_prob(data)

# MCMC
mcmc = MCMC(model, num_samples=1000)
mcmc.run()

# 事後分布
posterior = mcmc.get_samples()

print(posterior)

プロット

import matplotlib.pyplot as plt

# 試行回数
total_count = torch.tensor(10)

# 成功確率
probs = torch.linspace(0., 1., 100)

# 二項分布
binomial = torch.distributions.binomial.Binomial(total_count, probs)

# 確率
p = binomial.pmf(torch.arange(0, total_count + 1))

# プロット
plt.plot(probs, p)
plt.xlabel("成功確率")
plt.ylabel("確率")
plt.show()

PyTorch Binomial の他の方法

torch.distributions.Categorical を使う

import torch

# 試行回数
total_count = torch.tensor(10)

# 成功確率
probs = torch.tensor([0.5, 0.5])

# カテゴリー分布
categorical = torch.distributions.Categorical(probs)

# 3回表が出る確率
p3 = categorical.log_prob(torch.tensor(3))

# 4回表が出る確率
p4 = categorical.log_prob(torch.tensor(4))

print(f"3回表: {p3}")
print(f"4回表: {p4}")

手計算

二項分布の確率は、以下の式で計算できます。

P(X = k) = nCk * p^k * (1-p)^(n-k)

n: 試行回数
k: 成功回数
p: 成功確率
nCk: n個のものからk個を選ぶ組み合わせ

def binomial_pmf(n, k, p):
  """
  二項分布の確率質量関数

  Args:
      n: 試行回数
      k: 成功回数
      p: 成功確率

  Returns:
      確率
  """
  from math import factorial
  return factorial(n) / (factorial(k) * factorial(n-k)) * p**k * (1-p)**(n-k)

# 試行回数
n = 10

# 成功回数
k = 3

# 成功確率
p = 0.5

# 確率
p = binomial_pmf(n, k, p)

print(f"確率: {p}")

PyTorch の torch.distributions.binomial.Binomial クラス以外にも、二項分布を扱う方法はいくつかあります。それぞれの方法にはメリットとデメリットがあるので、状況に合わせて使い分けることが重要です。

PyTorch で二項分布を扱う：torch.distributions.binomial.Binomial の使い方

PyTorch の確率分布における二項分布：torch.distributions.binomial.Binomial

PyTorch Binomial サンプルコード

確率計算

サンプリング

事後分布

ベイズ推論

プロット

PyTorch Binomial の他の方法

torch.distributions.Categorical を使う

手計算

パフォーマンス向上：PyTorch Dataset と DataLoader でデータローディングを最適化する

PyTorchの逆フーリエ変換：torch.fft.ihfftnとその他の方法

画像処理に役立つ PyTorch の Discrete Fourier Transforms と torch.fft.ihfft2()

torch.fft.ifftを使いこなせ！画像処理・音声処理・機械学習の強力なツール

PyTorchで多 boyut DFT：torch.fft.hfftn()の使い方とサンプルコード

PyTorch FX の Node.kwargs を用いたサンプルコード集：実践的なプログラミングを学ぶ

PyTorch「torch.distributions.dirichlet.Dirichlet.has_rsample」：詳細解説とサンプルコード

NumPyのnp.swapaxes関数とPyTorchのtorch.swapaxes関数の比較

PyTorch Miscellaneous: 隠れた機能 torch.overrides.wrap_torch_function()

torch.Tensor.ormqr() 関数に関する参考情報