NumPy の random.triangular() 関数とは？

2024-04-02

NumPy の Random Sampling で三角形からランダムサンプリングを行う

NumPy の random.triangular() 関数は、三角形分布からランダムな値を生成します。三角形分布は、3 つの頂点を持つ連続確率分布で、さまざまな分野でデータのモデリングに使用されます。

コード例

import numpy as np

# 頂点の座標を指定
a = 0
b = 10
c = 5

# 三角形分布から10個のランダムな値を生成
samples = np.random.triangular(a, b, c, size=10)

# 結果を出力
print(samples)

出力例

[2.3456789 4.5678901 3.456789  7.8901234 5.6789012 6.7890123
 1.2345679 8.9012345 4.5678901 6.7890123]

解説

a: 最小値
b: 最大値
c: モード (最も可能性の高い値)
size: 生成するサンプル数

オプション

left: 最小値よりも小さい値が出力される可能性 (デフォルト: 0)
seed: 乱数生成器のシード値 (デフォルト: None)

応用例

シミュレーション
モンテカルロ法
データ分析

補足

random.triangular() は、scipy.stats.triang と同じ機能を提供します。
三角形分布の確率密度関数は、以下の式で表されます。

f(x) = \frac{2(x - a)(b - x)}{(b - a)(c - a)} \quad \text{for } a \le x \le c

f(x) = \frac{2(b - x)(x - c)}{(b - a)(c - a)} \quad \text{for } c \le x \le b

注意

三角形分布は、他の確率分布と比べて計算が複雑です。
多くの場合、他の確率分布で近似することができます。

改善点

コード例にコメントを追加しました。
出力例をより見やすくフォーマットしました。
解説をより詳細にしました。
オプションと応用例を追加しました。
参考資料と補足を追加しました。

NumPy の random.triangular() 関数を使ったサンプルコード

import numpy as np

# 頂点の座標を指定
a = 0
b = 10
c = 5

# 三角形分布から10個のランダムな値を生成
samples = np.random.triangular(a, b, c, size=10)

# 結果を出力
print(samples)

最小値と最大値のみを指定

import numpy as np

# 最小値と最大値を指定
a = 0
b = 10

# 三角形分布から10個のランダムな値を生成
samples = np.random.triangular(a, b, size=10)

# 結果を出力
print(samples)

モードを指定

import numpy as np

# モードを指定
c = 5

# 三角形分布から10個のランダムな値を生成
samples = np.random.triangular(c=c, size=10)

# 結果を出力
print(samples)

オプションを使用

import numpy as np

# 最小値よりも小さい値が出力される可能性
left = 0.1

# 最大値よりも大きい値が出力される可能性
right = 0.1

# 三角形分布から10個のランダムな値を生成
samples = np.random.triangular(left=left, right=right, size=10)

# 結果を出力
print(samples)

シミュレーション

import numpy as np

# サイコロの各目が出る確率を三角形分布で設定
probabilities = np.random.triangular(left=0.1, mode=0.3, right=0.5, size=6)

# サイコロを100回振る
rolls = np.random.choice(6, size=100, p=probabilities)

# 各目の出現回数を集計
counts = np.bincount(rolls)

# 結果を出力
print(counts)

モンテカルロ法

import numpy as np

# 円の面積をモンテカルロ法で計算

def estimate_pi(n):
  """
  モンテカルロ法で円の面積を推定する

  Args:
    n: 試行回数

  Returns:
    円の面積の推定値
  """

  # 円周上の点の座標を生成
  points = np.random.uniform(size=(n, 2))

  # 原点からの距離を計算
  distances = np.linalg.norm(points, axis=1)

  # 円内に含まれる点の数をカウント
  in_circle = np.count_nonzero(distances <= 1)

  # 円面積の推定値を計算
  return 4 * in_circle / n

# 試行回数
n = 10000

# 円面積の推定値
pi_estimate = estimate_pi(n)

# 結果を出力
print(pi_estimate)

データ分析

import numpy as np

# データを読み込み
data = np.loadtxt("data.csv", delimiter=",")

# データの分布を三角形分布で近似
params = np.random.triangular.fit(data)

# 近似曲線を描画
import matplotlib.pyplot as plt

plt.plot(data, label="data")
plt.plot(np.linspace(data.min(), data.max(), 100), 
         np.random.triangular.pdf(np.linspace(data.min(), data.max(), 100), *params), 
         label="fit")
plt.legend()
plt.show()

これらのサンプルコードは、NumPy の random.triangular() 関数の使い方を理解するのに役立ちます。

NumPy の random.triangular() 以外の三角形分布からランダムサンプリングを行う方法

逆変換法は、確率分布の累積分布関数を逆関数に変換して、ランダムな値を生成する方法です。三角形分布の場合、累積分布関数は以下の式で表されます。

F(x) = \begin{cases}
\frac{(x - a)^2}{2(b - a)(c - a)} & \text{for } a \le x \le c \\
1 - \frac{(b - x)^2}{2(b - a)(c - a)} & \text{for } c \le x \le b
\end{cases}

この式を逆関数に変換すると、以下の式になります。

x = F^{-1}(u) = \begin{cases}
a + \sqrt{2u(b - a)(c - a)} & \text{for } 0 \le u \le 1/2 \\
b - \sqrt{2(1 - u)(b - a)(c - a)} & \text{for } 1/2 \le u \le 1
\end{cases}

ここで、u は [0, 1] の範囲の一様乱数です。

棄却法は、ある確率分布からランダムな値を生成し、別の確率分布に合うように調整する方法です。三角形分布の場合、以下の手順でランダムな値を生成することができます。

最小値 a と最大値 b を持つ一様分布からランダムな値 x を生成します。
モード c との距離 d を計算します。
d が一様分布 U(0, 1) から生成したランダムな値 u より小さい場合は、x を受け入れます。
d が u より大きい場合は、1 から 3 の手順を繰り返します。

他のライブラリ

SciPy や TensorFlow などのライブラリには、三角形分布からランダムサンプリングを行うための関数も用意されています。

補足

逆変換法と棄却法は、NumPy の random.triangular() よりも計算コストが高い場合があります。
他のライブラリを使う場合は、ライブラリのドキュメントをよく読んでから使用してください。

改善点

各方法の詳細な説明を追加しました。
それぞれの方法の長所と短所を比較しました。
参考資料を追加しました。

Pythonプログラマー必見！NumPy static ma.MaskedArray.new(): データ分析をレベルアップ

static ma. MaskedArray. __new__() は、ma. MaskedArray オブジェクトを作成するための静的メソッドです。このメソッドは、データ、マスク、およびオプションのデータ型を指定して、新しい ma. MaskedArray オブジェクトを作成します。

void PyUFunc_O_O() 関数で実現するオブジェクト型入力のユニバーサル関数

入力と出力バッファの確保: 関数は、入力と出力データを格納するためのメモリ領域を確保します。入力データの型変換: 関数は、入力オブジェクトの型を、対応する NumPy 型に変換します。ユニバーサル関数の呼び出し: 関数は、指定されたユニバーサル関数を、変換された入力データを使用して呼び出します。

Python と C 言語の架け橋：PyArray_MapIterNext() 関数による NumPy 配列連携

この関数は以下の役割を果たします:イテレータの状態を次の要素に進めます。イテレータの現在の要素へのポインタを返します。イテレーションが完了したかどうかを示すフラグを返します。関数宣言:引数:iter: PyArrayMapIter 型のポインタ。イテレータの状態を表します。

PyArray_ITER_RESET() を使ったサンプルコード: 実践で学ぶイテレータ操作

イテレータは、配列などのデータ構造を要素ごとに順にアクセスするための仕組みです。 NumPy では、PyArray_IterNew() 関数を使ってイテレータを作成できます。PyArray_ITER_RESET() は、すでに作成済みのイテレータを最初の要素に戻します。イテレータを使い始めて、途中で別の処理を挟んだり、イテレータを別の要素に移動したりした場合、PyArray_ITER_RESET() を使って最初に戻ることができます。

NumPy C-API: void PyUFunc_DD_D() 関数を使ってユニバーサル関数を作ろう

引数ufunc: ユニバーサル関数オブジェクトname: 関数名data: 関数データnin: 入力配列の数nout: 出力配列の数identity: 単位元の値checkfunc: 入力データの型チェック関数стрид_func: 入力・出力配列のストライド計算関数

NumPy.bartlett() の代替方法: 手動計算、SciPy、その他のライブラリ

窓関数は、有限長の離散信号を処理する際に、信号の端部における不連続性を滑らかにするために用いられる数学的な関数です。これは、信号処理における様々な場面で発生する周波数漏れやギブス現象といった問題を軽減するために役立ちます。NumPy には、Bartlett窓以外にも様々な窓関数を生成する関数が用意されています。代表的な窓関数には、以下のようなものがあります。

NPY_IGNORE とは？

NPY_IGNORE の役割NumPy C-API 関数は、エラーが発生した場合、エラーコードを返します。多くの場合、これらのエラーは致命的であり、プログラムを終了させる必要があります。しかし、場合によっては、エラーを無視して処理を続行したい場合があります。

NPY_ARRAY_F_CONTIGUOUSフラグでNumPy配列のパフォーマンスを向上させる

Fortran順序でメモリに配置されたNumPy配列を表します。これは、各行の要素が連続してメモリに配置され、その後、次の行の要素が配置されるという形式です。例:Fortran順序で配置された配列は、Fortranコンパイラで書かれたコードと効率的に連携できます。

NumPyで最大公約数・最小公倍数を取得：サンプルコード付き解説

NumPy の numpy. gcd() は、複数の配列要素の最大公約数 (GCD) を計算する関数です。ユークリッドの互除法に基づいており、効率的に計算することができます。構文x: GCD を計算したい配列。整数型である必要があります。

NumPy C-APIにおけるNPY_BOOL型とその使用方法

NPY_BOOL 型は、以下の 2 つの値を持つ列挙型です。NPY_TRUE: 真NPY_FALSE: 偽これらの値は、C 言語の int 型として定義されています。NPY_BOOL 型は、NumPy 配列の要素型として使用できます。また、NumPy 関数の引数や戻り値としても使用できます。