PyTorchで画像処理： torch.fft.fftshift() を活用した高度なテクニック

2024-04-02

PyTorch の Discrete Fourier Transforms に関連する torch.fft.fftshift() の解説

PyTorch は、Python で機械学習モデルを構築するためのオープンソースライブラリです。torch.fft モジュールは、離散フーリエ変換 (DFT) と関連する関数を提供します。

DFT とは

DFT は、連続時間信号を離散時間信号に変換するための数学的な操作です。これは、信号処理、画像処理、音声処理など、さまざまな分野で使用されています。

torch.fft.fftshift() は、DFT の出力結果の順序を入れ替える関数です。DFT の出力結果は、通常、正の周波数と負の周波数が交互に並んでいます。fftshift() を使用すると、負の周波数が正の周波数の前に配置されます。

fftshift() の利点

周波数スペクトルを視覚化する際に便利です。
逆 DFT を計算する際に必要です。

fftshift() は、torch.fft モジュールの関数です。以下の引数を受け取ります。

input: DFT の出力結果
dim: 順序を入れ替える軸

以下の例は、1次元 DFT の出力結果に対して fftshift() を使用する方法を示しています。

import torch

# 1次元 DFT の出力結果
x = torch.fft.fft(torch.randn(10))

# 順序を入れ替える
y = torch.fft.fftshift(x)

# 結果を表示
print(y)

この例では、y は x の負の周波数が正の周波数の前に配置された結果となります。

fftshift() の注意点

fftshift() は、DFT の出力結果に対してのみ使用できます。
入力データが偶数長でない場合、fftshift() はエラーが発生します。

torch.fft.fftshift() は、PyTorch で DFT を使用する際に役立つ関数です。この関数は、DFT の出力結果の順序を入れ替えることができ、周波数スペクトルを視覚化したり、逆 DFT を計算したりする際に便利です。

PyTorch の torch.fft.fftshift() を使用したサンプルコード

1次元 DFT と fftshift()

import torch

# 1次元データ
x = torch.randn(10)

# DFT の計算
y = torch.fft.fft(x)

# 順序を入れ替える
y_shifted = torch.fft.fftshift(y)

# 結果を表示
print(f"元のデータ: {x}")
print(f"DFT の出力結果: {y}")
print(f"fftshift() の出力結果: {y_shifted}")

2次元 DFT と fftshift()

import torch

# 2次元データ
x = torch.randn(10, 10)

# DFT の計算
y = torch.fft.fft2(x)

# 順序を入れ替える
y_shifted = torch.fft.fftshift(y)

# 結果を表示
print(f"元のデータ: {x}")
print(f"DFT の出力結果: {y}")
print(f"fftshift() の出力結果: {y_shifted}")

この例では、2次元データに対して DFT を計算し、fftshift() を使用して出力結果の順序を入れ替えています。

逆 DFT と fftshift()

import torch

# DFT の出力結果
y = torch.fft.fft(torch.randn(10))

# 順序を入れ替える
y_shifted = torch.fft.fftshift(y)

# 逆 DFT を計算
x = torch.fft.ifft(y_shifted)

# 結果を表示
print(f"元のデータ: {x}")
print(f"逆 DFT の出力結果: {x}")

この例では、DFT の出力結果に対して fftshift() を使用し、逆 DFT を計算しています。

周波数スペクトルの可視化

import torch
import matplotlib.pyplot as plt

# 1次元データ
x = torch.randn(10)

# DFT の計算
y = torch.fft.fft(x)

# 順序を入れ替える
y_shifted = torch.fft.fftshift(y)

# 周波数スペクトルを表示
plt.plot(torch.abs(y_shifted))
plt.show()

この例では、1次元データに対して DFT を計算し、fftshift() を使用して出力結果の順序を入れ替えています。その後、周波数スペクトルを可視化しています。

画像処理

import torch
import matplotlib.pyplot as plt
from PIL import Image

# 画像を読み込み
img = Image.open("image.png").convert("L")

# 2次元 DFT を計算
y = torch.fft.fft2(torch.from_numpy(np.array(img)))

# 順序を入れ替える
y_shifted = torch.fft.fftshift(y)

# 低周波成分のみを残す
y_filtered = torch.fft.ifft2(y_shifted)

# 結果を表示
plt.subplot(121)
plt.imshow(img, cmap="gray")
plt.title("Original Image")

plt.subplot(122)
plt.imshow(torch.abs(y_filtered), cmap="gray")
plt.title("Filtered Image")

plt.show()

この例では、画像を読み込み、2次元 DFT を計算します。その後、fftshift() を使用して出力結果の順序を入れ替え、低周波成分のみを残します。最後に、処理結果を表示しています。

PyTorch の torch.fft.fftshift() 以外の方法

周波数スペクトルを可視化する他の方法

matplotlib.pyplot.specgram()
librosa.display.specshow()

画像処理の他の方法

高周波成分をカットする
バターワースフィルタなどのフィルタを使用する

numpy.fft.fftshift()
scipy.fftpack.fftshift()

具体的な例

周波数スペクトルを可視化する他の方法

import torch
import matplotlib.pyplot as plt

# 1次元データ
x = torch.randn(10)

# DFT の計算
y = torch.fft.fft(x)

# 周波数スペクトルを表示
plt.specgram(x, Fs=1000)
plt.show()

import librosa
import soundfile as sf

# 音声ファイルを読み込み
x, sr = sf.read("audio.wav")

# スペクトログラムを表示
librosa.display.specshow(librosa.stft(x), sr=sr)
plt.show()

画像処理の他の方法

import torch
import matplotlib.pyplot as plt
from PIL import Image

# 画像を読み込み
img = Image.open("image.png").convert("L")

# 2次元 DFT を計算
y = torch.fft.fft2(torch.from_numpy(np.array(img)))

# 高周波成分をカット
y_filtered = torch.fft.ifft2(y * torch.exp(-(torch.abs(y) ** 2) / 100))

# 結果を表示
plt.subplot(121)
plt.imshow(img, cmap="gray")
plt.title("Original Image")

plt.subplot(122)
plt.imshow(torch.abs(y_filtered), cmap="gray")
plt.title("Filtered Image")

plt.show()

import torch
import matplotlib.pyplot as plt
from PIL import Image

# 画像を読み込み
img = Image.open("image.png").convert("L")

# バターワースフィルタを適用
b, a = butterworth(2, 0.1)
y_filtered = filtfilt(b, a, torch.from_numpy(np.array(img)))

# 結果を表示
plt.subplot(121)
plt.imshow(img, cmap="gray")
plt.title("Original Image")

plt.subplot(122)
plt.imshow(y_filtered, cmap="gray")
plt.title("Filtered Image")

plt.show()

PyTorchで画像処理： torch.fft.fftshift() を活用した高度なテクニック

PyTorch の Discrete Fourier Transforms に関連する torch.fft.fftshift() の解説

PyTorch の torch.fft.fftshift() を使用したサンプルコード

1次元 DFT と fftshift()

2次元 DFT と fftshift()

逆 DFT と fftshift()

周波数スペクトルの可視化

画像処理

PyTorch の torch.fft.fftshift() 以外の方法

周波数スペクトルを可視化する他の方法

画像処理の他の方法

具体的な例

周波数スペクトルを可視化する他の方法

画像処理の他の方法

パフォーマンス向上：PyTorch Dataset と DataLoader でデータローディングを最適化する

torch.fft.ifftを使いこなせ！画像処理・音声処理・機械学習の強力なツール

PyTorch初心者でも安心！torch.fft.fftnを使ったサンプルコード集

PyTorchで信号処理を行うその他の方法：フィルタリング、スペクトログラム、波形生成

画像処理に役立つ PyTorch の Discrete Fourier Transforms と torch.fft.ihfft2()

PyTorchで確率分布を操る：RelaxedOneHotCategoricalと温度パラメータの魔法

PyTorch QInt32Storage を活用した量子化技術：メモリ効率とパフォーマンスの向上

torch.ao.quantization.qconfig_mapping.get_default_qat_qconfig_mapping の使い方

ゼロから理解する PyTorch Parameter Initializations: torch.nn.init.zeros_() の詳細

画像認識におけるアダプティブプーリングの重要性と torch.nn.functional.adaptive_avg_pool3d の役割