AI

scikit-learnで教師あり学習

IT工房では機械学習の解説を行っています。 教師あり学習とは、説明変数から目的変数を予測するモデルを作成するために、正解の目的変数から学習する方法です。 そのため、必ず説明変数と同時に正解となるような目的変数を用意する必要があります。 ...
AI

グリッドサーチで便利なnp.logspace関数

グリッドサーチで桁の違う小数などを使いたい場合、np.logspace関数が便利です。 例 np.logspace(-3, 2, num=6) 10の-3乗から10の2乗の範囲を6等分した配列 を作成します。 ...
lecture

Pythonでローカルサーバーを作る

pythonを使った、超シンプルなローカルサーバーの作成方法です。 Macの場合の例です。 事前に適当な場所に適当な名前のフォルダを作成しておいて、ターミナルのcdコマンドで移動しておきます。 次に、作成したフォルダ内に「inde...
AI

Pandasの使い方まとめ(機械学習の事前準備でよく使う機能)

機械学習を行う前の事前処理として、よく使うPandasの機能をまとめています。 1.とりあえず読み込んでおきたいライブラリ, 2.ファイルの読み込みと保存, 3.CSVファイルの読み込み, 4.CSVファイルの保存, 5.データの確認, 6.変数別の基本統計量の確認, 7.先頭からの表示, 8.後ろからの表示, 9.列に複数の同じ値がある場合、それぞれの値の数を調べる, 10.欠損値処理, 11.欠損値の削除, 12.欠損値を平均値で埋める, 13.欠損値を0にしてそれ以外の文字列を1にする, 14.欠損値に他の列の値を利用, 15.教師データの分離と削除, 16.教師データ分離, 17.教師データ削除(説明変数作成), 18.ダミー変数作成, 19.ダミー変数作成, 20.2値のカテゴリ変数を数値に変換, 21複数のカテゴリ変数をそのまま数値化する これ、結構使える, 22.複数のカテゴリ変数をそのまま数値化する factorize関数を使わない方法, 23.標準化, 24.学習用データとテストデータの分離, 25.ホールドアウト法, 26.列の値の取得, 27.ユニークな値の取得, 28.ある列の値を条件判定しておいて、Trueの行の別の列の値の平均をとる, 29.PandasからNumpyに変換とその逆, 30.Pandas形式のデータをNumpy形式にする方法, 31.Numpy形式のデータをPandas形式にする方法, 32.要素の頻度(出現回数), 33.ビニング処理(ビン分割),
lecture

Pythonで日付と時間を扱う方法

datetimeモジュール datetimeモジュールでは、以下4個のメインオブジェクトを定義しています。 年⽉⽇を対象にするdate 時分秒を対象にするtime ⽇時と時刻両⽅を対象にするdatetime ...
AI

単回帰分析でScikit-learnに説明変数を準備する際の注意点

Scikit-learnの単回帰分析で説明変数の指定する時の注意点です。 初心者はハマりやすいところですから注意しましょう。 次のサンプルは'G1'(1学期の成績)から単回帰分析を行い'G3'(最終学期)の成績を予測するモデルです。...
AI

Pandasの行や列の削除 drop関数とdel文

Pandasで作成した行列で特定の行や列を削除するにはdrop関数を使います。 drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False...
AI

PandasのDataFrameで作成した表のデータを省略しない方法

PandasのDataFrameで表を作成した時大量のデータがあると途中が省略されて表示されます。 たまには省略せずに全てのデータを見たい場合もあるでしょう。 その場合は次の記述で表示できます。 データの表示を省略なしで表示する...
python

Numpy配列の統計関数 mean(0)の意味

Numpy配列の統計関数で平均を求める mean()関数ですが、時々 mean(0)のような記述があります。 これは mean(axis=0)を省略した記述です。 axisは多次元配列に対する引数で、引数axisに0を渡すと列ごと、...
AI

機械学習で大量のデータが欲しい時のまとめ

オープンデータ DATA.GO.JP LinkData.org 画像系 「機械学習はデータ集めるのが一番大変・・・」 YouTube-8M Open Images Datas...
スポンサーリンク
タイトルとURLをコピーしました