解 説

Pandasは外部のデータをPythonに取り込み、表として表示してくれたり集計したりと非常に便利なライブラリです。
PandasにはSeriesとDataFrameがありデータ構造を作成するものです。
機械学習やデータ分析を行う上で簡単にデータ構造を作ったり、あるいは別の資料から読み込んだりできて非常に便利なものです。

PandasのSeriesを使う

Seriesは1次元のデータ構造を作るものです。簡単に言うと便利なメソッドを持った配列を作るものです。
以下はSeriesの使い方の例です。

結果
Oda 20
Toyotomi 45
Tokugawa 60
Asikaga 53
Taira 31
dtype: int64

結果
20

ある値以上のものを表示する例

結果
Toyotomi 45
Tokugawa 60
Asikaga 53
dtype: int64

Seriesを辞書に変更する例

結果
{‘Asikaga’: 53, ‘Oda’: 20, ‘Taira’: 31, ‘Tokugawa’: 60, ‘Toyotomi’: 45}

辞書をSeriesに変更する例

結果
Asikaga 53
Oda 20
Taira 31
Tokugawa 60
Toyotomi 45
dtype: int64

Seriesに名前をつけることができます。

結果
Oda 20
Toyotomi 45
Tokugawa 60
Asikaga 53
Taira 31
Name: 年齢一覧, dtype: int64

indexに名前をつける

結果
名前
Oda 20
Toyotomi 45
Tokugawa 60
Asikaga 53
Taira 31
Name: 年齢一覧, dtype: int64

DataFrameの使い方

DataFrameは2次元のデータ構造を作ります。簡単にいうと表を作るものです。

コピーしたデータ(クリップボードのデータ)を使う方法

食品成分ランキングのページの表をコピーして利用してみます。

pandasのインポート

ここでネット上のデータ(tableなどで作成されたデータ)をコピーします。

次のコードでコピーしたデーターをPythonに読み込み、Jupyter上に表として表示します。

表示結果

表のヘッダ部分を表示するには以下のようにします。

結果
Index([‘順位’, ‘食品名’, ‘成分量’], dtype=’object’)

特定の列だけを表示させる例です。

結果

複数の列も指定することができます。

結果

head()は最初から5行まで表示します。引数を入れると引数で指定した行まで表示します。

結果

結果

下から数えて表示したい場合はtail()を使います。これも引数で何番目までか指定できます。

結果

新規で列を増やすこともできます。

結果

np.arange()で配列を作成して挿入することもできます。

結果

Series()で配列を作成して新しい列に挿入する例

結果

特定の列を削除するには「del」を使用します。

結果

辞書をPandasで表にする

結果