PyTorchで事前学習済みモデルを使う：torch.utils.model_zoo徹底解説

2024-04-02

PyTorch Miscellaneous: torch.utils.model_zoo 解説

モデルのロード

torch.utils.model_zoo でモデルをロードするには、以下のコードを使用します。

import torch
from torch.utils.model_zoo import load_url

model = load_url("https://download.pytorch.org/models/resnet18-5c18.pth")

このコードは、ImageNet データセットで事前学習済みの ResNet-18 モデルをダウンロードしてロードします。

モデルの種類

torch.utils.model_zoo には、様々な種類のモデルが用意されています。

画像認識: ResNet、AlexNet、VGG など
自然言語処理: BERT、GPT-2、DistilBERT など
音声認識: WaveNet、Tacotron など

モデルの種類は、torch.utils.model_zoo.urlmap で確認できます。

モデルの使い方

モデルをロードしたら、model.forward() メソッドを使って推論を行うことができます。

import torch

# モデルのロード
model = load_url("https://download.pytorch.org/models/resnet18-5c18.pth")

# 推論
input = torch.randn(1, 3, 224, 224)
output = model(input)

このコードは、ランダムな画像を入力として、ResNet-18 モデルの推論結果を出力します。

torch.utils.model_zoo は、PyTorch で事前学習済みのモデルを簡単にロードするための便利なツールです。このツールを使うと、画像認識、自然言語処理、音声認識など、様々なタスクで使えるモデルを手に入れることができます。

補足

torch.utils.model_zoo は、PyTorch 1.0 以降で使用できます。

PyTorch Miscellaneous: torch.utils.model_zoo サンプルコード

画像認識

ResNet-18 で画像分類

import torch
from torch.utils.model_zoo import load_url

# モデルのロード
model = load_url("https://download.pytorch.org/models/resnet18-5c18.pth")

# 画像の読み込み
from PIL import Image
import torchvision.transforms as transforms

image = Image.open("image.jpg")
transform = transforms.Compose([
    transforms.Resize(256),
    transforms.CenterCrop(224),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])
input = transform(image).unsqueeze(0)

# 推論
output = model(input)

# 結果の表示
import numpy as np

print(f"予測ラベル: {np.argmax(output.detach().numpy())}")

転移学習

import torch
from torch.utils.model_zoo import load_url

# モデルのロード
model = load_url("https://download.pytorch.org/models/resnet18-5c18.pth")

# 転移学習用の新しい最後の層を定義
num_classes = 10  # 分類したいクラス数

new_fc = torch.nn.Linear(model.fc.in_features, num_classes)

# モデルに新しい最後の層を追加
model.fc = new_fc

# ...

# 訓練と推論

自然言語処理

BERT でテキスト分類

import torch
from torch.utils.model_zoo import load_url

# モデルのロード
model = load_url("https://download.pytorch.org/models/bert-base-uncased.pt")

# トークナイゼーション
from transformers import BertTokenizer

tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")

text = "This is a sentence to be classified."
tokens = tokenizer.encode(text)
input_ids = torch.tensor(tokens).unsqueeze(0)

# 推論
output = model(input_ids)

# 結果の表示
import numpy as np

print(f"予測ラベル: {np.argmax(output.detach().numpy())}")

音声認識

WaveNet で音声合成

import torch
from torch.utils.model_zoo import load_url

# モデルのロード
model = load_url("https://download.pytorch.org/models/wavernn-v3.pt")

# 音声データの読み込み
import librosa

audio, sr = librosa.load("audio.wav")

# 音声データの前処理
audio = torch.from_numpy(audio).float()

# 音声合成
output = model(audio)

# 結果の保存
import soundfile

soundfile.write("output.wav", output.detach().numpy(), sr)

上記はほんの一例です。torch.utils.model_zoo は、様々なタスクで利用できます。

PyTorch Miscellaneous: 事前学習済みのモデルを利用するその他の方法

Hugging Face Transformers は、自然言語処理向けの事前学習済みのモデルを多数提供しています。

from transformers import AutoModel

model = AutoModel.from_pretrained("bert-base-uncased")

timm は、画像認識向けの事前学習済みのモデルを多数提供しています。

import timm

model = timm.create_model("resnet18", pretrained=True)

ONNX Runtime は、様々なフレームワークで訓練されたモデルを推論するためのツールです。ONNX Runtime を使えば、PyTorch 以外のフレームワークで訓練されたモデルを PyTorch で推論することができます。

import onnxruntime

sess = onnxruntime.InferenceSession("model.onnx")

# 推論
output = sess.run([], {"input": input})

自身のコードでロード

事前学習済みのモデルのパラメータファイルを手動でダウンロードして、自身のコードでロードすることもできます。

import torch

# パラメータファイルのダウンロード
# ...

# モデルのロード
model = torch.nn.Module()
model.load_state_dict(torch.load("model.pth"))

torch.utils.model_zoo は、PyTorch で事前学習済みのモデルを簡単に利用するための便利なツールです。しかし、他にも様々な方法があります。それぞれの方法の特徴を理解して、目的に合った方法を選択することが重要です。

PyTorchで事前学習済みモデルを使う：torch.utils.model_zoo徹底解説

PyTorch Miscellaneous: torch.utils.model_zoo 解説

モデルのロード

モデルの種類

モデルの使い方

補足

PyTorch Miscellaneous: torch.utils.model_zoo サンプルコード

画像認識

ResNet-18 で画像分類

転移学習

自然言語処理

BERT でテキスト分類

音声認識

WaveNet で音声合成

PyTorch Miscellaneous: 事前学習済みのモデルを利用するその他の方法

自身のコードでロード

PyTorchのC++バックトレースを取得：torch.utils.get_cpp_backtraceの使い方

PyTorch Tensorboard で PR 曲線を使って二値分類モデルの性能を評価する方法

PyTorch初心者向け：torch.var_mean関数でテンソルの分散と平均値をマスターしよう

PyTorch vmap チュートリアル：ベクトル化による高速化とコード簡潔化をマスターしよう！

PyTorchにおける torch.cuda.make_graphed_callables とは？

L1Lossに関するチュートリアル：PyTorchニューラルネットワークにおけるL1損失

PyTorch NN 関数における torch.nn.functional.celu の詳細解説

PyTorchの torch.fake_quantize_per_channel_affine 関数：詳細解説とサンプルコード

PyTorch 分散チェックポイント徹底解説：DefaultLoadPlanner を使いこなす