Traced Graph Export と torch.export.FakeTensor の使い方

2024-04-02

PyTorch: Traced Graph Export と torch.export.FakeTensor による効率的な推論

torch.export.FakeTensor は、Traced Graph Export と連携して、ダミーの入力データを使用してモデルのグラフをトレースする便利なツールです。これは、実際の入力データが利用できない場合や、モデルの動作を確認したい場合に役立ちます。

Traced Graph Export は、以下の手順で動作します。

モデルのトレース: torch.jit.trace 関数を使用して、モデルのグラフをトレースします。この過程で、モデルの演算とデータの流れが記録されます。
グラフの最適化: 記録されたグラフは、推論速度を向上させるために最適化されます。
グラフの保存: 最適化されたグラフは、torch.jit.save 関数を使用して、 .pt ファイルとして保存されます。

torch.export.FakeTensor は、以下の利点を提供します。

実際の入力データがなくてもモデルのトレースが可能: ダミーの入力データを作成することで、実際の入力データが利用できない場合でもモデルのグラフをトレースできます。
モデルの動作確認が容易: ダミーの入力データを使用して、モデルが期待通りに動作することを確認できます。
デバッグの容易化: ダミーの入力データを使用して、モデルの動作を段階的に確認することで、デバッグを容易化できます。

torch.export.FakeTensor を使用するには、以下の手順に従います。

ダミーの入力データを作成: モデルの入力データと一致する形状と型を持つダミーの入力データを作成します。
torch.export.FakeTensor を使用してダミーの入力データを作成:** ダミーの入力データを使用して、torch.export.FakeTensor 関数を呼び出し、FakeTensor オブジェクトを作成します。
FakeTensor オブジェクトをモデルの入力として使用:** FakeTensor オブジェクトをモデルの入力として使用して、モデルのグラフをトレースします。

まとめ

Traced Graph Export と torch.export.FakeTensor は、PyTorch モデルの推論速度を向上させるための強力なツールです。torch.export.FakeTensor を使用することで、実際の入力データがなくてもモデルのグラフをトレースし、モデルの動作を確認することができます。

その他

上記の情報は、PyTorch 1.10.0 をベースにしています。
より詳細な情報は、PyTorch の公式ドキュメントを参照してください。

Traced Graph Export と torch.export.FakeTensor を使ったサンプルコード

シンプルなモデル

import torch

class MyModel(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = torch.nn.Linear(1, 1)

    def forward(self, x):
        return self.linear(x)

model = MyModel()

# ダミーの入力データを作成
fake_input = torch.randn(1, 1)

# FakeTensor オブジェクトを作成
fake_tensor = torch.export.FakeTensor(fake_input)

# FakeTensor オブジェクトをモデルの入力として使用
traced_model = torch.jit.trace(model, fake_tensor)

# トレースされたモデルを保存
traced_model.save("my_model.pt")

モデルの入力に複数のテンサーを使用する

import torch

class MyModel(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.linear1 = torch.nn.Linear(1, 1)
        self.linear2 = torch.nn.Linear(1, 1)

    def forward(self, x, y):
        return self.linear1(x) + self.linear2(y)

model = MyModel()

# ダミーの入力データを作成
fake_input1 = torch.randn(1, 1)
fake_input2 = torch.randn(1, 1)

# FakeTensor オブジェクトを作成
fake_tensor1 = torch.export.FakeTensor(fake_input1)
fake_tensor2 = torch.export.FakeTensor(fake_input2)

# FakeTensor オブジェクトをモデルの入力として使用
traced_model = torch.jit.trace(model, fake_tensor1, fake_tensor2)

# トレースされたモデルを保存
traced_model.save("my_model.pt")

モデルの入力に可変長のテンサーを使用する

import torch

class MyModel(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.lstm = torch.nn.LSTM(1, 1)

    def forward(self, x):
        return self.lstm(x)

model = MyModel()

# ダミーの入力データを作成
fake_input = torch.randn(10, 1)

# FakeTensor オブジェクトを作成
fake_tensor = torch.export.FakeTensor(fake_input)

# FakeTensor オブジェクトをモデルの入力として使用
traced_model = torch.jit.trace(model, fake_tensor)

# トレースされたモデルを保存
traced_model.save("my_model.pt")

モデルの入力にカスタムデータ型を使用する

import torch

class MyData(object):
    def __init__(self, x):
        self.x = x

    def __len__(self):
        return len(self.x)

    def __getitem__(self, index):
        return self.x[index]

class MyModel(torch.nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = torch.nn.Linear(1, 1)

    def forward(self, x):
        return self.linear(x)

model = MyModel()

# ダミーの入力データを作成
fake_input = MyData(torch.randn(10, 1))

# FakeTensor オブジェクトを作成
fake_tensor = torch.export.FakeTensor(fake_input)

# FakeTensor オブジェクトをモデルの入力として使用
traced_model = torch.jit.trace(model, fake_tensor)

# トレースされたモデルを保存
traced_model.save("my_model.pt")

Traced Graph Export とは異なる推論高速化方法

モデルの軽量化

剪定: 重要度の低い接続を削除することで、モデルのサイズと計算量を削減します。
量子化: モデルの精度を維持しながら、データ型を低精度化することで、メモリ使用量と計算量を削減します。
蒸留: 大規模なモデルから学習した知識を、小さなモデルに移転することで、小さなモデルの精度を向上させます。

ハードウェアの活用

GPU: CPU よりも高い処理能力を持つ GPU を使用することで、推論速度を大幅に向上させることができます。
TPU: Google が開発した TPU は、機械学習ワークロード向けに特化

Traced Graph Export と torch.export.FakeTensor の使い方

PyTorch: Traced Graph Export と torch.export.FakeTensor による効率的な推論

まとめ

その他

Traced Graph Export と torch.export.FakeTensor を使ったサンプルコード

シンプルなモデル

モデルの入力に複数のテンサーを使用する

モデルの入力に可変長のテンサーを使用する

モデルの入力にカスタムデータ型を使用する

Traced Graph Export とは異なる推論高速化方法

モデルの軽量化

ハードウェアの活用

パフォーマンス向上：PyTorch Dataset と DataLoader でデータローディングを最適化する

PyTorchの逆フーリエ変換：torch.fft.ihfftnとその他の方法

PyTorchで画像処理： torch.fft.fftshift() を活用した高度なテクニック

PyTorch初心者でも安心！torch.fft.fftnを使ったサンプルコード集

PyTorchで多 boyut DFT：torch.fft.hfftn()の使い方とサンプルコード

PyTorchで確率分布を自在に操る：TransformedDistribution.cdf()のサンプルコード集

PyTorch Tensor の torch.Tensor.sspaddmm メソッド

PyTorchで逆双曲線正弦関数を計算する

PyTorch ニューラルネットワークのその他の方法

PyTorch Quantization: PrepareCustomConfig.to_dict() 関数徹底解説