torch.mps.profiler.stop() ：MPS デバイスのパフォーマンス分析をマスターする

2024-04-02

PyTorch MPS プロファイラーの停止： torch.mps.profiler.stop() の詳細解説

torch.mps.profiler.stop() は、以下の役割を担います。

プロファイリングセッションの終了: torch.mps.profiler.start() で開始されたプロファイリングセッションを終了します。
プロファイリング結果の収集: セッション中に収集されたデータを取り込み、分析可能な形式に変換します。
プロファイリング結果の出力: 収集されたデータは、コンソールやファイルに出力することができます。

torch.mps.profiler.stop() の使い方は非常にシンプルです。以下のコード例のように、torch.mps.profiler.stop() を呼び出すだけです。

import torch

# プロファイリングセッションの開始
torch.mps.profiler.start()

# ・・・ ここで、計測したい処理を実行 ・・・

# プロファイリングセッションの停止
torch.mps.profiler.stop()

# プロファイリング結果の出力
print(torch.mps.profiler.get_profile_data())

torch.mps.profiler.stop() は、torch.mps.profiler.start() とペアで使用する必要があります。torch.mps.profiler.start() を呼び出す前に torch.mps.profiler.stop() を呼び出すと、エラーが発生します。

torch.mps.profiler.stop() には、以下のオプション引数を指定することができます。

export_path: プロファイリング結果をファイルに保存する場合に指定します。
format: プロファイリング結果の出力形式を指定します。デフォルトは "json" です。

# プロファイリング結果を "profile.json" ファイルに保存
torch.mps.profiler.stop(export_path="profile.json")

# プロファイリング結果を CSV 形式で出力
torch.mps.profiler.stop(format="csv")

torch.mps.profiler.stop() は、MPS デバイス上でのみ使用できます。CPU デバイス上では使用できません。
torch.mps.profiler.stop() を呼び出す前に、必ず torch.mps.profiler.start() を呼び出しておく必要があります。
プロファイリングセッションが実行中の間は、パフォーマンスが低下する可能性があります。

まとめ

torch.mps.profiler.stop() は、PyTorch の MPS バックエンドにおけるプロファイリング機能を停止するための重要な関数です。この関数を使うことで、MPS デバイス上での演算の実行時間やメモリ使用量などの詳細な情報を取得することができます。

PyTorch MPS プロファイラー torch.mps.profiler.stop() のサンプルコード

基本的な使用例

import torch

# プロファイリングセッションの開始
torch.mps.profiler.start()

# ・・・ ここで、計測したい処理を実行 ・・・

# プロファイリングセッションの停止
torch.mps.profiler.stop()

# プロファイリング結果の出力
print(torch.mps.profiler.get_profile_data())

ファイルへの保存

import torch

# プロファイリングセッションの開始
torch.mps.profiler.start()

# ・・・ ここで、計測したい処理を実行 ・・・

# プロファイリングセッションの停止
torch.mps.profiler.stop(export_path="profile.json")

CSV 形式での出力

import torch

# プロファイリングセッションの開始
torch.mps.profiler.start()

# ・・・ ここで、計測したい処理を実行 ・・・

# プロファイリングセッションの停止
torch.mps.profiler.stop(format="csv")

MPS デバイスの選択

import torch

# 使用する MPS デバイスを選択
device = torch.device("mps")

# プロファイリングセッションの開始
torch.mps.profiler.start(device=device)

# ・・・ ここで、計測したい処理を実行 ・・・

# プロファイリングセッションの停止
torch.mps.profiler.stop()

詳細なオプション

import torch

# プロファイリングセッションの開始
torch.mps.profiler.start(
    profile_memory=True,  # メモリ使用量も計測
    profile_all_ops=True,  # すべての演算を計測
    export_path="profile.json",  # プロファイリング結果をファイルに保存
)

# ・・・ ここで、計測したい処理を実行 ・・・

# プロファイリングセッションの停止
torch.mps.profiler.stop()

PyTorch MPS プロファイリングのその他の方法

torch.cuda.profiler は、CUDA デバイス上での演算の実行時間やメモリ使用量などの詳細な情報を取得するためのツールです。MPS デバイスでも使用することができます。

import torch

# プロファイリングセッションの開始
torch.cuda.profiler.start()

# ・・・ ここで、計測したい処理を実行 ・・・

# プロファイリングセッションの停止
torch.cuda.profiler.stop()

# プロファイリング結果の出力
print(torch.cuda.profiler.get_profile_data())

NVIDIA Nsight Systems は、CUDA デバイスと MPS デバイスのパフォーマンスを分析するための包括的なツールです。

Intel VTune Amplifier は、CPU デバイスと GPU デバイスのパフォーマンスを分析するための包括的なツールです。MPS デバイスもサポートしています。

自作のツール

上記の方法以外にも、独自のツールを使って PyTorch MPS のパフォーマンスを分析することができます。

注意事項

上記の方法は、それぞれ異なる機能と利点を持っています。
使用する方法は、分析したい内容や環境によって異なります。
詳細については、各ツールのドキュメントを参照してください。

torch.mps.profiler.stop() ：MPS デバイスのパフォーマンス分析をマスターする

PyTorch MPS プロファイラーの停止： torch.mps.profiler.stop() の詳細解説

まとめ

PyTorch MPS プロファイラー torch.mps.profiler.stop() のサンプルコード

基本的な使用例

ファイルへの保存

CSV 形式での出力

MPS デバイスの選択

詳細なオプション

PyTorch MPS プロファイリングのその他の方法

パフォーマンス向上：PyTorch Dataset と DataLoader でデータローディングを最適化する

PyTorch MPS Profilerを使う以外のパフォーマンス分析方法

PyTorch Miscellaneous: torch.testing.assert_close() の詳細解説

ファイルディスクリプタ共有 vs ファイルシステム共有：torch.multiprocessing.get_sharing_strategy()で最適な共有戦略を選択

PyTorchで事前学習済みモデルを使う：torch.utils.model_zoo徹底解説

PyTorch Tensor.apply_() の完全解説！

タグで囲まれています。

PyTorch NN 関数におけるソフトマージン損失とは？

PyTorchの torch.fake_quantize_per_channel_affine 関数：詳細解説とサンプルコード

PyTorch初心者向け：torch.amaxでテンソルの最大値を取得する方法