AI

RidgeとLasso

過学習と正則化 機械学習で回帰分析する場合、多くの説明変数を使ってしまいがちです。しかし、大量の説明変数を使用すると隔たった学習用データに必要以上に対応してしまう「過学習」の状態になる場合があります。 そこで過学習になるのを防ぐために、極端な重みのデータに対してペナルティを与えるという正則化の方法が  >>続きを読む

Pandasのカテゴリ型

Pandasのカテゴリ型をうまく使うとことで、シンプルで効率の良いデータ加工ができます。 unique()関数 Seriesデータを作成 import numpy as np import pandas as pd values = pd.Series(['Apple',  >>続きを読む

scikit-learnで教師あり学習

教師あり学習とは、説明変数から目的変数を予測するモデルを作成するために、正解の目的変数から学習する方法です。 そのため、必ず説明変数と同時に正解となるような目的変数を用意する必要があります。 ちなみに、教師なし学習は正解例となる目的変数がない学習のことです。 *パラメータの表はscikit-lear  >>続きを読む

Pythonでローカルサーバーを作る

pythonを使った、超シンプルなローカルサーバーの作成方法です。 Macの場合の例です。 事前に適当な場所に適当な名前のフォルダを作成しておいて、ターミナルのcdコマンドで移動しておきます。 次に、作成したフォルダ内に「index.html」ファイルを作成しておきます。 同じフォルダ内に新規ファイ  >>続きを読む

Pythonで日付と時間を扱う方法

datetimeモジュール datetimeモジュールでは、以下4個のメインオブジェクトを定義しています。 年⽉⽇を対象にするdate 時分秒を対象にするtime ⽇時と時刻両⽅を対象にするdatetime ⽇付と時刻の間隔を対象にするtimedelta 同じような名前のオブジェクトが含まれています  >>続きを読む

Numpyのmat関数について

Numpyには行列オブジェクトを作成するためのmat()が用意されています。 一般的にNumpyの大多数の操作がndarray型を返しているためmat()関数は特別な理由が無い限り使用しない方が良いでしょう。 けれども、知っておいて損は無いかもしれません。 次の例は、ndarray型の行列とmatr  >>続きを読む

Python関数のデフォルト引数の注意点

ミュータブルな型とイミュータブルな型 Pythonは全ての型が参照渡しになっています。 ただし、イミュータブルな型のものはデータが更新されると新たなメモリ領域を確保する仕組みになっています。 つまり、何らかデータの変更が行われた段階で新たなメモリ領域を確保して参照するようになります。 Pythonの  >>続きを読む