PyTorch Sparse Tensors の詳細情報

2024-04-02

PyTorch Sparse Tensors における torch.sparse.torch.Tensor.ccol_indices の詳細解説

PyTorch Sparse Tensors は、多くの要素がゼロであるようなテンサーを効率的に表現するためのデータ構造です。従来の稠密テンサーとは異なり、Sparse Tensors は非ゼロ要素のみを保存することでメモリ使用量を削減し、計算速度を向上させることができます。

torch.sparse.torch.Tensor.ccol_indices は、Sparse Tensors の重要な属性の一つです。これは、各非ゼロ要素が属する列のインデックスを保存するテンサーです。この属性を理解することで、Sparse Tensors の構造と操作をより深く理解することができます。

ccol_indices の詳細

データ型: torch.LongTensor
形状: (N, ) または (N, block_size)
内容:
- N は非ゼロ要素の個数
- 各要素は、その非ゼロ要素が属する列のインデックスを表す
- block_size > 1 の場合、各要素はブロック内のインデックスを表す

ccol_indices の使い方

特定の列の非ゼロ要素を取得
特定の列の値を変更
Sparse Tensor の構造を理解

例

import torch

# COO形式の Sparse Tensor を作成
indices = torch.tensor([[0, 0], [1, 2]])
values = torch.tensor([3, 4])
shape = (2, 3)
sparse_tensor = torch.sparse_coo_tensor(indices, values, shape)

# ccol_indices 属性を確認
print(sparse_tensor.ccol_indices)
# tensor([0, 2])

# 特定の列の非ゼロ要素を取得
col_idx = 1
col_indices = sparse_tensor.ccol_indices == col_idx
non_zero_elements = sparse_tensor.values[col_indices]

# 特定の列の値を変更
sparse_tensor.values[col_indices] = 5

# Sparse Tensor の構造を理解
# 各行の非ゼロ要素の列インデックスを確認
row_0_cols = sparse_tensor.ccol_indices[sparse_tensor.row_indices == 0]
row_1_cols = sparse_tensor.ccol_indices[sparse_tensor.row_indices == 1]

補足

ccol_indices 属性は、COO形式の Sparse Tensor でのみ使用できます。
CSR形式やCSC形式の Sparse Tensor では、col_indices 属性を使用する必要があります。
PyTorch Sparse Tensors に関する詳細は、公式ドキュメントを参照してください。

PyTorch Sparse Tensors のサンプルコード

COO形式の Sparse Tensor 作成

import torch

# 行インデックス、列インデックス、値をそれぞれ定義
row_indices = torch.tensor([0, 1, 1, 0])
col_indices = torch.tensor([0, 2, 0, 1])
values = torch.tensor([3, 4, 5, 6])

# COO形式の Sparse Tensor を作成
shape = (2, 3)
sparse_tensor = torch.sparse_coo_tensor(
    indices=(row_indices, col_indices), values=values, shape=shape
)

# 確認
print(sparse_tensor)
# 0  3  0
# 6  0  4

CSR形式の Sparse Tensor 作成

import torch

# 行インデックス、列インデックス、値、ポインターをそれぞれ定義
row_indices = torch.tensor([0, 1, 2, 0, 1])
col_indices = torch.tensor([0, 2, 0, 1, 2])
values = torch.tensor([3, 4, 5, 6, 7])
row_pointers = torch.tensor([0, 2, 4, 5])

# CSR形式の Sparse Tensor を作成
shape = (2, 3)
sparse_tensor = torch.sparse_csr_tensor(
    indices=(row_indices, col_indices), values=values, row_pointers=row_pointers, shape=shape
)

# 確認
print(sparse_tensor)
# 0  3  0
# 6  0  4

CSC形式の Sparse Tensor 作成

import torch

# 行インデックス、列インデックス、値、ポインターをそれぞれ定義
row_indices = torch.tensor([0, 1, 2, 0, 1])
col_indices = torch.tensor([0, 2, 0, 1, 2])
values = torch.tensor([3, 4, 5, 6, 7])
col_pointers = torch.tensor([0, 2, 4, 5])

# CSC形式の Sparse Tensor を作成
shape = (2, 3)
sparse_tensor = torch.sparse_csc_tensor(
    indices=(row_indices, col_indices), values=values, col_pointers=col_pointers, shape=shape
)

# 確認
print(sparse_tensor)
# 0  3  0
# 6  0  4

Sparse Tensor の要素へのアクセス

import torch

# COO形式の Sparse Tensor を作成
row_indices = torch.tensor([0, 1, 1, 0])
col_indices = torch.tensor([0, 2, 0, 1])
values = torch.tensor([3, 4, 5, 6])
shape = (2, 3)
sparse_tensor = torch.sparse_coo_tensor(
    indices=(row_indices, col_indices), values=values, shape=shape
)

# 特定の行、列の要素を取得
row = 1
col = 2
value = sparse_tensor[row, col]

# 確認
print(value)
# 4

Sparse Tensor の演算

import torch

# 2つの Sparse Tensor を作成
sparse_tensor_1 = torch.sparse_coo_tensor(
    indices=((0, 0), (1, 2)), values=(3, 4), shape=(2, 3)
)
sparse_tensor_2 = torch.sparse_coo_tensor(
    indices=((0, 1), (1, 0)), values=(5, 6), shape=(2, 3)
)

# 加算
sum_tensor = sparse_tensor_1 + sparse_tensor_2

# 確認
print(sum_tensor)
# 3  8  0
# 6  4  10

Sparse Tensor の変換

PyTorch Sparse Tensors のその他の方法

疎行列の積

import torch

# COO形式の Sparse Tensor を作成
sparse_tensor_1 = torch.sparse_coo_tensor(
    indices=((0, 0), (1, 2)), values=(3, 4), shape=(2, 3)
)
sparse_tensor_2 = torch.sparse_coo_tensor(
    indices=((0, 1), (1, 0)), values=(5, 6), shape=(2, 3)
)

# 疎行列の積
product_tensor = torch.sparse_mm(sparse_tensor_1, sparse_tensor_2)

# 確認
print(product_tensor)
# 9  18
# 12  24

疎行列の転置

import torch

# COO形式の Sparse Tensor を作成
sparse_tensor = torch.sparse_coo_tensor(
    indices=((0, 0), (1, 2)), values=(3, 4), shape=(2, 3)
)

# 転置
transpose_tensor = sparse_tensor.t()

# 確認
print(transpose_tensor)
# 3  0
# 4  2

疎行列の削減

import torch

# COO形式の Sparse Tensor を作成
sparse_tensor = torch.sparse_coo_tensor(
    indices=((0, 0), (1, 2), (1, 1)), values=(3, 4, 5), shape=(2, 3)
)

# 行方向に合計
sum_tensor = sparse_tensor.sum(dim=1)

# 確認
print(sum_tensor)
# [3 9]

疎行列の要素の比較

import torch

# COO形式の Sparse Tensor を作成
sparse_tensor = torch.sparse_coo_tensor(
    indices=((0, 0), (1, 2), (1, 1)), values=(3, 4, 5), shape=(2, 3)
)

# すべての要素が 0 より大きいかどうかを確認
all_greater_than_zero = torch.all(sparse_tensor > 0)

# 確認
print(all_greater_than_zero)
# False

疎行列の非ゼロ要素のインデックス取得

import torch

# COO形式の Sparse Tensor を作成
sparse_tensor = torch.sparse_coo_tensor(
    indices=((0, 0), (1, 2), (1, 1)), values=(3, 4, 5), shape=(2, 3)
)

# 非ゼロ要素のインデックスを取得
non_zero_indices = sparse_tensor._indices()

# 確認
print(non_zero_indices)
# (tensor([0, 1, 1]), tensor([0, 2, 1]))

疎行列の可視化

import torch

# COO形式の Sparse Tensor を作成
sparse_tensor = torch.sparse_coo_tensor(
    indices=((0, 0), (1, 2), (1, 1)), values=(3, 4, 5), shape=(2, 3)
)

# 疎行列を可視化
import matplotlib.pyplot as plt

plt.spy(sparse_tensor)
plt.show()

PyTorch Sparse Tensors の詳細情報

PyTorch Sparse Tensors における torch.sparse.torch.Tensor.ccol_indices の詳細解説

PyTorch Sparse Tensors のサンプルコード

COO形式の Sparse Tensor 作成

CSR形式の Sparse Tensor 作成

CSC形式の Sparse Tensor 作成

Sparse Tensor の要素へのアクセス

Sparse Tensor の演算

Sparse Tensor の変換

PyTorch Sparse Tensors のその他の方法

疎行列の積

疎行列の転置

疎行列の削減

疎行列の要素の比較

疎行列の非ゼロ要素のインデックス取得

疎行列の可視化

パフォーマンス向上：PyTorch Dataset と DataLoader でデータローディングを最適化する

PyTorch C++ 拡張開発をレベルアップ！ include パス取得の奥義をマスターしよう

PyTorchで事前学習済みモデルを使う：torch.utils.model_zoo徹底解説

PyTorch Miscellaneous: torch.testing.assert_close() の詳細解説

PyTorchのC++バックトレースを取得：torch.utils.get_cpp_backtraceの使い方

サンプルコード付き！PyTorch Quantizationの「torch.ao.ns._numeric_suite.Shadow.add_relu()」でモデル精度を評価

PyTorchで離散確率分布を扱う：torch.distributions.categorical.Categoricalの解説

PyTorch MPS の高度なテクニック：torch.mps.Event でコードの可能性を最大限に引き出す

PyTorch Tensorboard で PR 曲線を使って二値分類モデルの性能を評価する方法

PyTorchのStudentT.rsample()：確率分布からランダムサンプルを生成