IT工房 ブログ

機械学習の事前準備でよく使うPandasの機能

機械学習の事前準備に使うPandasの機能 機械学習を行う前の事前処理として、よく使うPandasの機能をまとめています。 さらに詳細なコードはGitHubのコードを参考にしてください。 import文 とりあえず読み込んでおきたいライブラリ import numpy as np import nu  >>続きを読む

Pythonで日付と時間を扱う方法

datetimeモジュール datetimeモジュールでは、以下4個のメインオブジェクトを定義しています。 年⽉⽇を対象にするdate 時分秒を対象にするtime ⽇時と時刻両⽅を対象にするdatetime ⽇付と時刻の間隔を対象にするtimedelta 同じような名前のオブジェクトが含まれています  >>続きを読む

PandasのDataFrameで作成した表のデータを省略しない方法

PandasのDataFrameで表を作成した時大量のデータがあると途中が省略されて表示されます。 たまには省略せずに全てのデータを見たい場合もあるでしょう。 その場合は次の記述で表示できます。 データの表示を省略なしで表示する方法 それぞれ第2引数が表示行数 行の省略を無くす pd.set_op  >>続きを読む

Numpy配列の統計関数 mean(0)の意味

Numpy配列の統計関数で平均を求める mean()関数ですが、時々 mean(0)のような記述があります。 これは mean(axis=0)を省略した記述です。 axisは多次元配列に対する引数で、引数axisに0を渡すと列ごと、1を渡すと行ごとの演算結果が得られます。 通常、0は行、1は列を表し  >>続きを読む

matplotlibの日本語化

matplotlibの日本語化面倒くさいですね。 バージョンが変わるとまた表示されなくなったりで。。 超簡単な方法がありました。 zerofromlightさんのサイトからの情報です。 次のように、インストールします。 WinやColaboratoryの場合はpip pip3 install jap  >>続きを読む

Numpyのmat関数について

Numpyには行列オブジェクトを作成するためのmat()が用意されています。 一般的にNumpyの大多数の操作がndarray型を返しているためmat()関数は特別な理由が無い限り使用しない方が良いでしょう。 けれども、知っておいて損は無いかもしれません。 次の例は、ndarray型の行列とmatr  >>続きを読む

Python関数のデフォルト引数の注意点

ミュータブルな型とイミュータブルな型 Pythonは全ての型が参照渡しになっています。 ただし、イミュータブルな型のものはデータが更新されると新たなメモリ領域を確保する仕組みになっています。 つまり、何らかデータの変更が行われた段階で新たなメモリ領域を確保して参照するようになります。 Pythonの  >>続きを読む