AI

AI

Numpy  スライスについて(動画あり)

Numpyのスライシング NumpyのスライスはPythonのリストのスライスと少し違った方法で行えます。 Pythonのリストとndarayの本質的な違いは、スライスが元のndarayのビューであ流ことです。つまりコピ...
AI

Numpy  乱数の使い方(動画あり)

Numpyの乱数 Numpy には様々な乱数を発生させる関数が用意されています。 乱数を作成する時に、シードを指定すると何度実行しても同じ乱数が得られることになります。 seed()の引数の値は何を使ってもよいので...
AI

Numpyの計算について、ソートの方法、基本統計量の関数(動画あり)

numpy配列の算術計算 numpy配列では、算術計算の方法がリストと違います。 この場合、ベクトル演算を行います。つまり、同サイズの配列の場合同位置の要素どうしで計算されます。 numpy配列の計算例 結果 ...
AI

Numpy入門 Numpy配列の作り方(動画あり)

Numpyについて numpyは「Numerical python」の意味でPythonの数値計算における最も重要な基本パッケージです。 機械学習ではベクトルや行列、テンソルなどのデータ構造が頻繁に使用されます。Numpyは...
AI

RidgeとLasso

過学習と正則化 機械学習で回帰分析する場合、多くの説明変数を使ってしまいがちです。しかし、大量の説明変数を使用すると隔たった学習用データに必要以上に対応してしまう「過学習」の状態になる場合があります。 そこで過学習になるのを防ぐために、...
AI

Pandas活用 factorize()関数の意味がわかる:Pandasのカテゴリ型データの取り扱い 

統計学で使うデータは大きく分けると「質的変数」と「量的変数」に分かれます。 質的変数:データがカテゴリで示されるもの 名義尺度:男女、電話番号(単に区別するだけ) 順序尺度:優、良、可...
AI

scikit-learnで教師あり学習

IT工房では機械学習の解説を行っています。 教師あり学習とは、説明変数から目的変数を予測するモデルを作成するために、正解の目的変数から学習する方法です。 そのため、必ず説明変数と同時に正解となるような目的変数を用意する必要があります。 ...
AI

Pandasの使い方まとめ(機械学習の事前準備でよく使う機能)

機械学習を行う前の事前処理として、よく使うPandasの機能をまとめています。 1.とりあえず読み込んでおきたいライブラリ, 2.ファイルの読み込みと保存, 3.CSVファイルの読み込み, 4.CSVファイルの保存, 5.データの確認, 6.変数別の基本統計量の確認, 7.先頭からの表示, 8.後ろからの表示, 9.列に複数の同じ値がある場合、それぞれの値の数を調べる, 10.欠損値処理, 11.欠損値の削除, 12.欠損値を平均値で埋める, 13.欠損値を0にしてそれ以外の文字列を1にする, 14.欠損値に他の列の値を利用, 15.教師データの分離と削除, 16.教師データ分離, 17.教師データ削除(説明変数作成), 18.ダミー変数作成, 19.ダミー変数作成, 20.2値のカテゴリ変数を数値に変換, 21複数のカテゴリ変数をそのまま数値化する これ、結構使える, 22.複数のカテゴリ変数をそのまま数値化する factorize関数を使わない方法, 23.標準化, 24.学習用データとテストデータの分離, 25.ホールドアウト法, 26.列の値の取得, 27.ユニークな値の取得, 28.ある列の値を条件判定しておいて、Trueの行の別の列の値の平均をとる, 29.PandasからNumpyに変換とその逆, 30.Pandas形式のデータをNumpy形式にする方法, 31.Numpy形式のデータをPandas形式にする方法, 32.要素の頻度(出現回数), 33.ビニング処理(ビン分割),
AI

単回帰分析でScikit-learnに説明変数を準備する際の注意点

Scikit-learnの単回帰分析で説明変数の指定する時の注意点です。 初心者はハマりやすいところですから注意しましょう。 次のサンプルは'G1'(1学期の成績)から単回帰分析を行い'G3'(最終学期)の成績を予測するモデルです。...
AI

Pandasの行や列の削除 drop関数とdel文

Pandasで作成した行列で特定の行や列を削除するにはdrop関数を使います。 drop(labels=None, axis=0, index=None, columns=None, level=None, inplace=False...
スポンサーリンク
タイトルとURLをコピーしました