Pandasは機械学習やディープラーニングを行う上で、データの前処理など頻繁に使用します。
まずは徹底して使いなれるようにしましょう。エクセルを扱うよりもPandas を扱う方が楽だと思えるようになるまでいじり倒しましょう。
DataFrameの作成
まずは、簡単なDataFrame作成を覚えます。
import numpy as np import pandas as pd data_f1 = pd.DataFrame({'name':['Tahara','Suzuki','Yamada','Isono'], 'id':[1,2,3,4], 'age':[48,30,28,51], 'weight':[60,78,64,58], 'height':[168,173,162,172]}) data_f1
表示結果
data_f2 = pd.DataFrame({'id':[1,2,3,4,5,6], 'math':[80,74,48,58,28,97], 'english':[68,72,68,90,46,76], 'science':[86,73,52,72,89,45]}) data_f2
表示結果
ソートの方法
特定のカラムだけソートする場合
data_f1.height.sort_values()
表示結果
—————————————————
2 162
0 168
3 172
1 173
Name: height, dtype: int64
—————————————————
特定のカラムを基準ソートして全てのデータを並べ換える
data_f1.sort_values(by=["weight"], ascending=True)
表示結果
データ結合
内部結合(inner join)
data_m = pd.merge(data_f1,data_f2) data_m
表示結果
全結合(outer join)
data_mo = pd.merge(data_f1,data_f2,how = 'outer') data_mo
表示結果
左外部結合
data_lo = pd.merge(data_f1,data_f2,how = 'left') data_lo
表示結果
右外部結合
data_mr = pd.merge(data_f1,data_f2,how = 'right') data_mr
表示結果
コメントを投稿するにはログインしてください。