解 説

Pandasは機械学習やディープラーニングを行う上で、データの前処理など頻繁に使用します。
まずは徹底して使いなれるようにしましょう。エクセルを扱うよりもPandas を扱う方が楽だと思えるようになるまでいじり倒しましょう。

DataFrameの作成

まずは、簡単なDataFrame作成を覚えます。

import numpy as np
import pandas as pd

data_f1 = pd.DataFrame({'name':['Tahara','Suzuki','Yamada','Isono'],
          'id':[1,2,3,4],
          'age':[48,30,28,51],
          'weight':[60,78,64,58],
          'height':[168,173,162,172]})
data_f1

表示結果

data_f2 = pd.DataFrame({'id':[1,2,3,4,5,6],
          'math':[80,74,48,58,28,97],
          'english':[68,72,68,90,46,76],
          'science':[86,73,52,72,89,45]})
data_f2

表示結果

ソートの方法

特定のカラムだけソートする場合

data_f1.height.sort_values()

表示結果

—————————————————
2 162
0 168
3 172
1 173
Name: height, dtype: int64
—————————————————

特定のカラムを基準ソートして全てのデータを並べ換える

data_f1.sort_values(by=["weight"], ascending=True)

表示結果

データ結合

内部結合(inner join)

data_m = pd.merge(data_f1,data_f2)
data_m

表示結果

全結合(outer join)

data_mo = pd.merge(data_f1,data_f2,how = 'outer')
data_mo

表示結果

左外部結合

data_lo = pd.merge(data_f1,data_f2,how = 'left')
data_lo

表示結果

右外部結合

data_mr = pd.merge(data_f1,data_f2,how = 'right')
data_mr

表示結果