Pandas Series オブジェクトのインデックスを sort_index メソッドでソートする

2024-04-02

pandas.Series.sort_index メソッド解説

メソッド概要

メソッド名: sort_index
引数:
- level: ソートするインデックスレベルを指定します。デフォルトは None で、すべてのレベルをソートします。
- ascending: True の場合は昇順、False の場合は降順にソートします。デフォルトは True です。
- inplace: True の場合は元の Series オブジェクトを書き換えます。False の場合は新しい Series オブジェクトを返します。デフォルトは False です。

メソッドの例

import pandas as pd

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=['c', 'a', 'b'])

# インデックスを昇順に並べ替える
s = s.sort_index()

# 結果
# a    1
# b    2
# c    3

# インデックスを降順に並べ替える
s = s.sort_index(ascending=False)

# 結果
# c    3
# b    2
# a    1

# 特定のレベルをソートする
s = pd.Series([3, 1, 2], index=[('c', 1), ('a', 2), ('b', 3)])

# レベル1を昇順に並べ替える
s = s.sort_index(level=1)

# 結果
# (a, 2)    1
# (b, 3)    2
# (c, 1)    3

メソッドの注意点

inplace=True を指定すると元の Series オブジェクトが書き換えられるため、注意が必要です。
ソートするインデックスに重複がある場合、結果は予測できません。

sort_index メソッドは、Series オブジェクトだけでなく、DataFrame オブジェクトにも使用できます。
sort_values メソッドは、Series オブジェクトの値に基づいて並べ替えるためのメソッドです。

pandas.Series.sort_index メソッドのサンプルコード

サンプルコード1: インデックスを昇順または降順に並べ替える

import pandas as pd

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=['c', 'a', 'b'])

# インデックスを昇順に並べ替える
s = s.sort_index()

# 結果
# a    1
# b    2
# c    3

# インデックスを降順に並べ替える
s = s.sort_index(ascending=False)

# 結果
# c    3
# b    2
# a    1

サンプルコード2: 特定のレベルをソートする

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=[('c', 1), ('a', 2), ('b', 3)])

# レベル1を昇順に並べ替える
s = s.sort_index(level=1)

# 結果
# (a, 2)    1
# (b, 3)    2
# (c, 1)    3

サンプルコード3: inplace オプション

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=['c', 'a', 'b'])

# inplace オプションを使用してインデックスを昇順に並べ替える
s.sort_index(inplace=True)

# 結果
# s
# a    1
# b    2
# c    3

サンプルコード4: ソート後のインデックス

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=['c', 'a', 'b'])

# ソート後のインデックスを取得
sorted_index = s.sort_index().index

# 結果
# sorted_index
# Index(['a', 'b', 'c'], dtype='object')

サンプルコード5: 欠損値の処理

# Series オブジェクトを作成
s = pd.Series([3, 1, np.nan, 2], index=['c', 'a', 'b', 'd'])

# 欠損値を無視してインデックスを昇順に並べ替える
s = s.sort_index(na_position='last')

# 結果
# a    1.000000
# b    2.000000
# c    3.000000
# d    NaN

# 欠損値を一番最初に並べ替える
s = s.sort_index(na_position='first')

# 結果
# d    NaN
# a    1.000000
# b    2.000000
# c    3.000000

サンプルコード6: 複数レベルのインデックス

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=[('c', 1), ('a', 2), ('b', 3)])

# レベル0とレベル1の両方でソートする
s = s.sort_index(level=[0, 1])

# 結果
# (a, 2)    1
# (b, 3)    2
# (c, 1)    3

pandas.Series.sort_index メソッド以外の方法

sorted() 関数を使用して、Series オブジェクトのインデックスをリストとして取得し、ソートしてから reindex() メソッドを使用して元の Series オブジェクトを再構築することができます。

import pandas as pd

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=['c', 'a', 'b'])

# sorted() 関数を使用してインデックスをソート
sorted_index = sorted(s.index)

# reindex() メソッドを使用してソート後の Series オブジェクトを作成
s = s.reindex(sorted_index)

# 結果
# s
# a    1
# b    2
# c    3

.iloc[] アクセサーを使用して、インデックスの順番を指定して Series オブジェクトの値を取得することができます。

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=['c', 'a', 'b'])

# .iloc[] アクセサーを使用してソート後の Series オブジェクトを作成
s = s.iloc[[1, 2, 0]]

# 結果
# s
# a    1
# b    2
# c    3

.loc[] アクセサーを使用して、インデックスのラベルを指定して Series オブジェクトの値を取得することができます。

# Series オブジェクトを作成
s = pd.Series([3, 1, 2], index=['c', 'a', 'b'])

# .loc[] アクセサーを使用してソート後の Series オブジェクトを作成
s = s.loc[['a', 'b', 'c']]

# 結果
# s
# a    1
# b    2
# c    3

pandas.Series.sort_index メソッド以外にも、sorted() 関数、.iloc[] アクセサー、.loc[] アクセサーなどの方法を使用して Series オブジェクトのインデックスを並べ替えることができます。それぞれの特徴を理解し、目的に合った方法を選択してください。

Pandas Series オブジェクトのインデックスを sort_index メソッドでソートする

pandas.Series.sort_index メソッド解説

メソッド概要

メソッドの例

メソッドの注意点

pandas.Series.sort_index メソッドのサンプルコード

サンプルコード1: インデックスを昇順または降順に並べ替える

サンプルコード2: 特定のレベルをソートする

サンプルコード3: inplace オプション

サンプルコード4: ソート後のインデックス

サンプルコード5: 欠損値の処理

サンプルコード6: 複数レベルのインデックス

pandas.Series.sort_index メソッド以外の方法

Pandas Data Offsets：CustomBusinessHour.rule_code徹底解説

Pandas Data Offsets 入門：Hour.freqstrを使いこなして時系列データ操作をマスターしよう！

Pythonで会計年度を扱う： pandas.tseries.offsets.FY5253 徹底解説

Pandas Data Offsets: pandas.tseries.offsets.LastWeekOfMonth.kwds を駆使して毎月最後の週の金曜日にオフセットを設定する方法

Pandasでイースターの日付を扱う：Data offsetsとEaster.normalize

Pandas DataFrame を効率的に処理する：iterrows、apply、itertuples などのイテレーション方法を比較

Pandas Seriesのstr.rsplitを使いこなしてデータ分析を効率化！サンプルコード付きで徹底解説

pandas.tseries.offsets.BYearEnd.month 以外の方法

Pandas CategoricalIndex を理解し、順序なしのカテゴリリストに変換する方法

時系列データの分析に役立つ！Pandas Resampler.minのサンプルコード集