pythonってすごいね

RNAseqを用いた遺伝子発現量解析、機械学習を用いた回帰、分類などの解析を中心に記事を書いていきたいです!

インデックスの選択・インデックスの再設定 (pandas)

pythonのパッケージをimportする

from sklearn.datasets import load_iris
import pandas as pd

データを表示する

iris = load_iris() #テストデータとしてirisをロード
df = pd.DataFrame(iris.data, columns=iris.feature_names)#データフレームを作成 columnsでカラム名を指定する
print(df) #データを表示する

任意のインデックを消したい場合

df=df.drop(2,axis=0) # df.drop(#消したい軸, axis=0)
print(df)

指定したインデックス値を取得する

a=[0,3,5] #取得したいindex値をリスト化しておく
df.iloc[a,:] #数字の場合はiloc、文字の場合はlocを使う
print(df)

インデックスの値をリセットする(再設定する)

df=df.reset_index(drop=True)
print(df)

任意のカラムをインデックスにする

df.set_index("column_name")

カラムを消したくない場合

df.set_index("column_name", drop=False)

インデックス名を変更したい名前に変える

df.index=["column_name_1","column_name_2","column_name_3"]