Pandas Series.dt.freq 属性とは？

2024-04-02

Pandas Series.dt.freq：時系列データの分析に役立つ便利な属性

pandas.Series.dt.freq属性は、時系列データ分析において非常に役立つ機能です。この属性は、Seriesオブジェクトのインデックスに設定されている時系列データの周波数（頻度）を取得します。つまり、データポイントがどのくらいの頻度で記録されているかを知ることができます。

使い方

Series.dt.freq属性を使用するには、以下の手順に従います。

pandasライブラリをインポートします。
時系列データを含むSeriesオブジェクトを作成します。
dt.freq属性を使用して、周波数を取得します。

例

import pandas as pd

# 時系列データを含むSeriesオブジェクトを作成
dates = pd.to_datetime(['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05'])
data = pd.Series([10, 20, 30, 40, 50], index=dates)

# 周波数を取得
freq = data.dt.freq

# 結果を出力
print(freq)

出力

上記の例では、dataオブジェクトの周波数はD（日ごと）であることがわかります。

dt.freq属性を使用する利点は以下の通りです。

データの周波数を簡単に確認できる
データの分析に役立つ情報を得られる
データの可視化や処理を容易にする

dt.freq属性と関連する属性として、以下の属性があります。

dt.day：日付の日の部分を取得
dt.month：日付の月の部分を取得
dt.year：日付の年の部分を取得
dt.hour：時刻の時の部分を取得
dt.minute：時刻の分の部分を取得
dt.second：時刻の秒の部分を取得

これらの属性を組み合わせることで、時系列データの詳細な分析が可能になります。

補足

dt.freq属性は、pandasバージョン0.17.0以降で利用可能です。
dt.freq属性は、DatetimeIndexまたはTimedeltaIndexを持つSeriesオブジェクトでのみ使用できます。
周波数が不明な場合は、pd.infer_freq()関数を使用して推測することができます。

pandas.Series.dt.freq属性について、さらに質問があれば遠慮なく聞いてください。

Pandas Series.dt.freq サンプルコード集

import pandas as pd

# 時系列データを含むSeriesオブジェクトを作成
dates = pd.to_datetime(['2023-01-01', '2023-01-02', '2023-01-03', '2023-01-04', '2023-01-05'])
data = pd.Series([10, 20, 30, 40, 50], index=dates)

# 周波数を取得
freq = data.dt.freq

# 結果を出力
print(freq)

出力

特定の周波数でデータのフィルタリング

# 月ごとのデータのみ抽出
monthly_data = data.dt.freq == 'M'

# 結果を出力
print(monthly_data)

出力

0    False
1    False
2    False
3    False
4    False
dtype: bool

周波数に基づいたデータのグループ化

# 月ごとにデータをグループ化
monthly_data = data.groupby(data.dt.month)

# 各グループの平均値を計算
monthly_average = monthly_data.mean()

# 結果を出力
print(monthly_average)

出力

1    20.0
2    30.0
3    40.0
4    50.0
dtype: float64

時系列データのインデックスの変更

# データの周波数を日次から月次へ変更
monthly_data = data.resample('M')

# 結果を出力
print(monthly_data)

出力

2023-01-01    10
2023-02-01    20
2023-03-01    30
2023-04-01    40
2023-05-01    50
dtype: int64

欠損値の補完

# 欠損値を前日値で補完
data = data.fillna(method='ffill')

# 結果を出力
print(data)

出力

2023-01-01    10
2023-01-02    20
2023-01-03    30
2023-01-04    40
2023-01-05    50
dtype: int64

時系列データの可視化

import matplotlib.pyplot as plt

# 時系列データを折れ線グラフで表示
data.plot()
plt.show()

時系列データの季節性分析

from statsmodels.tsa.seasonal import seasonal_decompose

# 時系列データを季節性、トレンド、残差に分解
decomposition = seasonal_decompose(data, model='additive')

# 結果を出力
print(decomposition.seasonal)

出力

2023-01-01    0.000000
2023-01-02   -2.333333
2023-01-03   -4.666667
2023-01-04   -7.000000
2023-01-05   -9.333333
dtype: float64

時系列データの予測

from statsmodels.tsa.arima.model import ARIMA

# ARIMAモデルで時系列データを予測
model = ARIMA(data, order=(5, 1, 0))
model_fit = model.fit()

# 予測値を計算
forecast = model_fit.forecast(steps=5)

# 結果を出力
print(forecast)

出力

array([59.666667, 60.333333, 61.000000, 61.

時系列データ分析：Pandas Series.dt.freq 以外の方法

resample メソッドは、データの周波数を変更するために使用できます。

# データの周波数を日次から月次へ変更
monthly_data = data.resample('M')

# 結果を出力
print(monthly_data)

出力

2023-01-01    10
2023-02-01    20
2023-03-01    30
2023-04-01    40
2023-05-01    50
dtype: int64

groupby メソッドは、時系列データを周波数に基づいてグループ化するために使用できます。

# 月ごとにデータをグループ化
monthly_data = data.groupby(data.dt.month)

# 各グループの平均値を計算
monthly_average = monthly_data.mean()

# 結果を出力
print(monthly_average)

出力

1    20.0
2    30.0
3    40.0
4    50.0
dtype: float64

時系列分析ライブラリ

statsmodels や prophet などの時系列分析ライブラリは、季節性分析、トレンド分析、予測などの機能を提供します。

例：季節性分析

from statsmodels.tsa.seasonal import seasonal_decompose

# 時系列データを季節性、トレンド、残差に分解
decomposition = seasonal_decompose(data, model='additive')

# 結果を出力
print(decomposition.seasonal)

出力

2023-01-01    0.000000
2023-01-02   -2.333333
2023-01-03   -4.666667
2023-01-04   -7.000000
2023-01-05   -9.333333
dtype: float64

例：予測

from statsmodels.tsa.arima.model import ARIMA

# ARIMAモデルで時系列データを予測
model = ARIMA(data, order=(5, 1, 0))
model_fit = model.fit()

# 予測値を計算
forecast = model_fit.forecast(steps=5)

# 結果を出力
print(forecast)

出力

array([59.666667, 60.333333, 61.000000, 61.666667, 62.333333])

pandas.Series.dt.freq 属性は、時系列データ分析において非常に便利なツールです。しかし、他にもさまざまな方法があります。データの性質や分析目的に応じて、最適な方法を選択することが重要です。

Pandas Series.dt.freq 属性とは？

Pandas Series.dt.freq：時系列データの分析に役立つ便利な属性

Pandas Series.dt.freq サンプルコード集

時系列データ分析：Pandas Series.dt.freq 以外の方法

Pandas Data Offsets：BusinessDay.normalize メソッドの完全ガイド

Pandas Data Offsets と Tick.freqstr 属性：詳細解説とサンプルコード

Pandas BYearEnd オフセットで年末を自在に操る：データ分析の強力な武器

Pandas Data Offsets と BDay の使い方

PandasのMonthEnd.name属性：月単位の時系列データ分析をマスターするための必須アイテム

Pandas Seriesのallメソッド：初心者向けチュートリアル

Pandas Series dt.round関数：時間ベースのデータ分析を強力にサポート

Pandasでイースターの日付を扱う：Data offsetsとEaster.normalize

Pandas Index.drop_duplicates メソッド：重複行を効率的に削除

初心者でも安心！pandas.Series.str.catで文字列連結をマスターしよう