NumPy Universal functions と ufunc.reduceat()

2024-04-10

NumPy の Universal functions と ufunc.reduceat()

ufunc.reduceat() は、Universal functions を使って、配列の特定の軸に沿って部分的な集約を行う関数です。例えば、合計、平均、最大値、最小値などを計算することができます。

ufunc.reduceat() の使い方は以下の通りです。

numpy.ufunc.reduceat(array, indices, axis=None, out=None, keepdims=False)

引数

array: 入力配列
indices: 集約を行う軸のインデックス
axis: 集約を行う軸 (省略可能)
out: 出力配列 (省略可能)
keepdims: 次元を保持するかどうか (デフォルトは False)

例

以下の例では、1次元配列 a の奇数番目の要素の合計を計算します。

import numpy as np

a = np.array([1, 2, 3, 4, 5])
indices = np.array([1, 3])

result = np.ufunc.reduceat(np.add, a, indices)

print(result)

出力：

[6 10]

この例では、np.add という Universal function を使って、a の奇数番目の要素を合計しています。indices は、集約を行う軸のインデックスを指定します。この例では、1番目と3番目の要素を合計しています。

keepdims オプションを True に設定すると、出力配列の次元が元の配列と同じになります。

result = np.ufunc.reduceat(np.add, a, indices, keepdims=True)

print(result)

出力：

[[6]
 [10]]

この例では、出力配列は 2次元になっています。

ufunc.reduceat() は、以下の利点があります。

高速: C言語で実装されているため、ループ処理よりも高速に実行できます。
効率的: メモリ効率が良く、大きな配列に対しても効率的に処理できます。
汎用性: 様々な Universal functions と組み合わせて使用できます。

ufunc.reduceat() は、NumPy の Universal functions を使って、配列の特定の軸に沿って部分的な集約を行う強力なツールです。使い方は簡単で、高速、効率的、汎用性の高い関数です。

ufunc.reduceat() のサンプルコード

合計

import numpy as np

a = np.array([1, 2, 3, 4, 5])
indices = np.array([1, 3])

result = np.ufunc.reduceat(np.add, a, indices)

print(result)

出力：

[6 10]

平均

以下のコードは、2次元配列 a の各列の平均値を計算します。

a = np.array([[1, 2, 3], [4, 5, 6]])

result = np.ufunc.reduceat(np.mean, a, axis=0)

print(result)

出力：

[2.5 3.5 4.5]

最大値

以下のコードは、3次元配列 a の各列の最大値を計算します。

a = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])

result = np.ufunc.reduceat(np.max, a, axis=1)

print(result)

出力：

[[6 6]
 [12 12]]

最小値

以下のコードは、1次元配列 a の偶数番目の要素の最小値を計算します。

a = np.array([1, 2, 3, 4, 5])
indices = np.array([0, 2, 4])

result = np.ufunc.reduceat(np.min, a, indices)

print(result)

出力：

[1 3 5]

累積合計

以下のコードは、1次元配列 a の累積合計を計算します。

a = np.array([1, 2, 3, 4, 5])

result = np.ufunc.reduceat(np.add, a, np.arange(len(a)))

print(result)

出力：

[1 3 6 10 15]

累積積

以下のコードは、1次元配列 a の累積積を計算します。

a = np.array([1, 2, 3, 4, 5])

result = np.ufunc.reduceat(np.multiply, a, np.arange(len(a)))

print(result)

出力：

[1 2 6 24 120]

条件付き集約

以下のコードは、1次元配列 a の奇数番目の要素のうち、3 より大きい要素の合計を計算します。

import numpy as np

a = np.array([1, 2, 3, 4, 5])
indices = np.array([1, 3])

def my_func(a):
  return np.sum(a[a > 3])

result = np.ufunc.reduceat(my_func, a, indices)

print(result)

出力：

[10]

マスクを使用した集約

以下のコードは、1次元配列 a の奇数番目の要素の合計を、マスク mask を使って計算します。

import numpy as np

a = np.array([1, 2, 3, 4, 5])
mask = np.array([False, True, False, True, False])

result = np.ufunc.reduceat(np.add, a, np.arange(len(a))[mask])

print(result)

出力：

[6]

ufunc.reduceat() は、様々な集約操作を効率的に実行できる強力なツールです。上記のサンプルコード

ufunc.reduceat() 以外の方法

ループ処理

最も基本的な方法は、ループ処理を使って集約を行うことです。

def my_func(array, indices, axis=None):
  result = np.empty_like(indices)
  for i, index in enumerate(indices):
    if axis is None:
      result[i] = np.sum(array[index])
    else:
      result[i] = np.sum(array[index, :], axis=axis)
  return result

a = np.array([[1, 2, 3], [4, 5, 6]])
indices = np.array([0, 1])

result = my_func(a, indices)

print(result)

出力：

[3 15]

np.sum() と np.take() を組み合わせて、集約を行うこともできます。

a = np.array([[1, 2, 3], [4, 5, 6]])
indices = np.array([0, 1])

result = np.sum(np.take(a, indices, axis=0), axis=1)

print(result)

出力：

[3 15]

np.apply_along_axis() を使って、集約を行うこともできます。

def my_func(array):
  return np.sum(array)

a = np.array([[1, 2, 3], [4, 5, 6]])
indices = np.array([0, 1])

result = np.apply_along_axis(my_func, 0, a[indices])

print(result)

出力：

[3 15]

Pandas を使えば、より簡単に集約を行うことができます。

import pandas as pd

df = pd.DataFrame([[1, 2, 3], [4, 5, 6]])

result = df.groupby(level=0).sum()

print(result)

出力：

   0  1  2
0  3  5  7
1  9  12 15

ufunc.reduceat() 以外にも、様々な方法で配列の特定の軸に沿って部分的な集約を行うことができます。それぞれの方法にはメリットとデメリットがあり、状況に応じて使い分けることが重要です。

ループ処理

メリット：最も柔軟な方法
デメリット：速度が遅い

np.sum() と np.take()

メリット：比較的速い
デメリット：コードが冗長になる

Pandas

メリット：コードが簡潔
デメリット：NumPy よりもライブラリが大きい

NumPy Universal functions と ufunc.reduceat()

NumPy の Universal functions と ufunc.reduceat()

ufunc.reduceat() のサンプルコード

合計

平均

最大値

最小値

累積合計

累積積

条件付き集約

マスクを使用した集約

ufunc.reduceat() 以外の方法

NumPy C-API: void PyArray_UpdateFlags() 関数徹底解説

PyArray_ITER_RESET() を使ったサンプルコード: 実践で学ぶイテレータ操作

NumPy C-API: void PyUFunc_e_e_As_d_d() の詳細解説とサンプルコード集

NumPy C-API を用いたメモリ管理: void PyDimMem_FREE() 関数を中心に

NumPy C-API: void PyUFunc_f_f() 関数で始める高速 NumPy コード開発

NumPy ma.mask_or() の代替方法

NumPy.diff() 以外の差分計算方法

ma.MaskedArray.transpose() の注意事項

PyArray_Any() 関数のサンプルコード

C言語との連携： int itemsize で構造体とNumPy配列を橋渡し