PyTorchのBinomial分布モジュール：チュートリアル

2024-04-02

PyTorchの確率分布モジュールにおけるBinomial分布の確率計算：torch.distributions.binomial.Binomial.probs

PyTorchのtorch.distributionsモジュールは、確率分布を扱うための便利な機能を提供します。その中でも、torch.distributions.binomial.Binomialクラスは、二項分布に従う確率変数を扱うためのクラスです。

Binomial分布とは

二項分布は、n回の独立した試行において、成功となる確率がpであるとき、k回の成功を観察する確率を表す離散確率分布です。

torch.distributions.binomial.Binomial.probsは、二項分布に従う確率変数の確率質量関数を計算する関数です。

関数概要

torch.distributions.binomial.Binomial.probs(total_count, successes)

引数

total_count (int or Tensor): 試行回数
successes (int or Tensor): 成功回数

戻り値

probs (Tensor): 形状がtotal_count.shape + successes.shapeのTensor。各要素は、total_count回の試行においてsuccesses回の成功を観察する確率を表す。

例

import torch

# 試行回数と成功回数を設定
total_count = torch.tensor(10)
successes = torch.tensor(5)

# 二項分布オブジェクトを作成
binom = torch.distributions.binomial.Binomial(total_count, successes)

# 確率質量関数を計算
probs = binom.probs()

# 結果を出力
print(probs)

出力

tensor([0.00097656, 0.00488281, 0.01171875, 0.02050781, 0.02732227,
       0.02732227, 0.02050781, 0.01171875, 0.00488281, 0.00097656])

補足

total_countとsuccessesは、同じ形状のTensorである必要はありません。
probsの形状は、total_countとsuccessesの要素ごとの積となります。
probsの要素は、0から1までの範囲の値となります。

応用例

コイン投げで表が出る回数の確率計算
サイコロで6が出る回数の確率計算
製品検査における不良品の確率計算

torch.distributions.binomial.Binomialクラスには、probs以外にも、log_prob、cdf、icdfなどの様々な関数があります。これらの関数については、PyTorchのドキュメントを参照してください。

PyTorchのBinomial分布モジュール：サンプルコード

試行回数と成功回数を固定

import torch

# 試行回数と成功回数を設定
total_count = 10
successes = 5

# 二項分布オブジェクトを作成
binom = torch.distributions.binomial.Binomial(total_count, successes)

# 確率質量関数を計算
probs = binom.probs()

# 結果を出力
print(probs)

tensor(0.02732227)

試行回数と成功回数をTensorで設定

import torch

# 試行回数と成功回数をTensorで設定
total_count = torch.tensor([10, 20, 30])
successes = torch.tensor([5, 10, 15])

# 二項分布オブジェクトを作成
binom = torch.distributions.binomial.Binomial(total_count, successes)

# 確率質量関数を計算
probs = binom.probs()

# 結果を出力
print(probs)

出力

tensor([0.02732227, 0.04903932, 0.02732227])

確率質量関数を条件付きで計算

import torch

# 試行回数と成功回数をTensorで設定
total_count = torch.tensor([10, 20, 30])
successes = torch.tensor([5, 10, 15])

# 条件を設定
condition = (successes >= 5)

# 条件付きで確率質量関数を計算
probs = binom.probs(condition=condition)

# 結果を出力
print(probs)

出力

tensor([0.02732227, 0.04903932, 0.02732227])

累積分布関数 (CDF) を計算

import torch

# 試行回数と成功回数をTensorで設定
total_count = torch.tensor([10, 20, 30])
successes = torch.tensor([5, 10, 15])

# 二項分布オブジェクトを作成
binom = torch.distributions.binomial.Binomial(total_count, successes)

# 累積分布関数を計算
cdf = binom.cdf()

# 結果を出力
print(cdf)

出力

tensor([0.69140625, 0.99328125, 0.99999999])

逆累積分布関数 (ICDF) を計算

import torch

# 試行回数と成功回数をTensorで設定
total_count = torch.tensor([10, 20, 30])
successes = torch.tensor([5, 10, 15])

# 二項分布オブジェクトを作成
binom = torch.distributions.binomial.Binomial(total_count, successes)

# 逆累積分布関数を計算
icdf = binom.icdf()

# 結果を出力
print(icdf)

出力

tensor([5, 10, 15])

サンプリング

import torch

# 試行回数と成功回数をTensorで設定
total_count = torch.tensor([10, 20, 30])
successes = torch.tensor([5, 10, 15])

# 二項分布オブジェクトを作成
binom = torch.distributions.binomial.Binomial(total_count, successes)

# サンプルを生成
samples = binom.sample()

# 結果を出力
print(samples)

出力

tensor([[5, 5, 5],
       [10, 10, 10],
       [15, 15, 15]])

モジュールの詳細

torch.distributions.binomial.Binomialクラスには、上記以外にも様々な関数があります。詳細は、PyTorchのドキュメントを参照してください。

PyTorchで二項分布の確率質量関数を計算するその他の方法

手計算

P(k; n, p) = nCk * p^k * (1-p)^(n-k)

P(k; n, p): k回の成功を観察する確率
n: 試行回数
k: 成功回数
p: 成功確率
nCk: n個からk個を選ぶ組み合わせ

例えば、試行回数10回、成功確率0.5の場合、5回の成功を観察する確率は以下のように計算できます。

P(5; 10, 0.5) = 10C5 * 0.5^5 * (1-0.5)^(10-5) = 0.24609375

NumPyライブラリを使用する場合は、以下のコードで二項分布の確率質量関数を計算できます。

import numpy as np

def binomial_pmf(k, n, p):
  """
  二項分布の確率質量関数を計算

  Args:
      k: 成功回数
      n: 試行回数
      p: 成功確率

  Returns:
      確率質量関数
  """
  return np.math.factorial(n) / (np.math.factorial(k) * np.math.factorial(n-k)) * p**k * (1-p)**(n-k)

# 例
k = 5
n = 10
p = 0.5

pmf = binomial_pmf(k, n, p)

print(pmf)

出力

0.24609375

SciPyライブラリを使用する場合は、以下のコードで二項分布の確率質量関数を計算できます。

from scipy.stats import binom

# 例
k = 5
n = 10
p = 0.5

pmf = binom.pmf(k, n, p)

print(pmf)

出力

0.24609375

TensorFlowを使用する場合は、以下のコードで二項分布の確率質量関数を計算できます。

import tensorflow as tf

# 例
k = 5
n = 10
p = 0.5

pmf = tf.math.binomial(n, k, p)

print(pmf)

出力

tf.Tensor(0.24609375, shape=(), dtype=float32)

PyTorch以外にも、NumPy、SciPy、TensorFlowなどのライブラリを使用して二項分布の確率質量関数を計算することができます。それぞれのライブラリにはそれぞれの特徴 and 利点があるので、用途に合わせて使い分けることが重要です。

PyTorchのBinomial分布モジュール：チュートリアル

PyTorchの確率分布モジュールにおけるBinomial分布の確率計算：torch.distributions.binomial.Binomial.probs

PyTorchのBinomial分布モジュール：サンプルコード

試行回数と成功回数を固定

試行回数と成功回数をTensorで設定

確率質量関数を条件付きで計算

累積分布関数 (CDF) を計算

逆累積分布関数 (ICDF) を計算

サンプリング

モジュールの詳細

PyTorchで二項分布の確率質量関数を計算するその他の方法

手計算

パフォーマンス向上：PyTorch Dataset と DataLoader でデータローディングを最適化する

PyTorchで画像処理： torch.fft.fftshift() を活用した高度なテクニック

PyTorchの逆フーリエ変換：torch.fft.ihfftnとその他の方法

PyTorch初心者でも安心！torch.fft.fftnを使ったサンプルコード集

画像処理に役立つ PyTorch の Discrete Fourier Transforms と torch.fft.ihfft2()

PyTorch NN 関数における torch.nn.functional.nll_loss の詳細解説

Tensor Core を活用してさらに高速化！ torch.backends.cuda.matmul.allow_fp16_reduced_precision_reduction の活用方法

PyTorch Distributed Elastic の RendezvousHandler.shutdown() 関数とは？

torch.Tensor.remainder() を使って、PyTorch でテンソルの余りを計算する方法

PyTorch Tensor.apply_() の完全解説！