機械学習

AI

Pandas入門 Seriesの使い方

今回はPandasのSeriesについて、その基本を動画を使って学習します。 Pandasについて Pandasは高度なデータ構造を持ち、Pythonデータの整理や分析を簡単に行うことができます。 つまり、データ分析をより...
AI

Numpy で行列積を計算する方法〜np.dot関数を使う(動画あり)

機械学習やディープラーニングでは行列積の計算を頻繁に行います。 行列積とは何か。またそれをNumpyで行うにはどうすれば良いかを説明しています。 Numpyで行列計算 行列積について 例えば次のようなAと...
AI

Numpy  スライスについて(動画あり)

Numpyのスライシング NumpyのスライスはPythonのリストのスライスと少し違った方法で行えます。 Pythonのリストとndarayの本質的な違いは、スライスが元のndarayのビューであ流ことです。つまりコピ...
AI

Numpy  乱数の使い方(動画あり)

Numpyの乱数 Numpy には様々な乱数を発生させる関数が用意されています。 乱数を作成する時に、シードを指定すると何度実行しても同じ乱数が得られることになります。 seed()の引数の値は何を使ってもよいので...
AI

Numpyの計算について、ソートの方法、基本統計量の関数(動画あり)

numpy配列の算術計算 numpy配列では、算術計算の方法がリストと違います。 この場合、ベクトル演算を行います。つまり、同サイズの配列の場合同位置の要素どうしで計算されます。 numpy配列の計算例 結果 ...
AI

Numpy入門 Numpy配列の作り方(動画あり)

Numpyについて numpyは「Numerical python」の意味でPythonの数値計算における最も重要な基本パッケージです。 機械学習ではベクトルや行列、テンソルなどのデータ構造が頻繁に使用されます。Numpyは...
AI

scikit-learnで教師あり学習

IT工房では機械学習の解説を行っています。 教師あり学習とは、説明変数から目的変数を予測するモデルを作成するために、正解の目的変数から学習する方法です。 そのため、必ず説明変数と同時に正解となるような目的変数を用意する必要があります。 ...
AI

Pandasの使い方まとめ(機械学習の事前準備でよく使う機能)

機械学習を行う前の事前処理として、よく使うPandasの機能をまとめています。 1.とりあえず読み込んでおきたいライブラリ, 2.ファイルの読み込みと保存, 3.CSVファイルの読み込み, 4.CSVファイルの保存, 5.データの確認, 6.変数別の基本統計量の確認, 7.先頭からの表示, 8.後ろからの表示, 9.列に複数の同じ値がある場合、それぞれの値の数を調べる, 10.欠損値処理, 11.欠損値の削除, 12.欠損値を平均値で埋める, 13.欠損値を0にしてそれ以外の文字列を1にする, 14.欠損値に他の列の値を利用, 15.教師データの分離と削除, 16.教師データ分離, 17.教師データ削除(説明変数作成), 18.ダミー変数作成, 19.ダミー変数作成, 20.2値のカテゴリ変数を数値に変換, 21複数のカテゴリ変数をそのまま数値化する これ、結構使える, 22.複数のカテゴリ変数をそのまま数値化する factorize関数を使わない方法, 23.標準化, 24.学習用データとテストデータの分離, 25.ホールドアウト法, 26.列の値の取得, 27.ユニークな値の取得, 28.ある列の値を条件判定しておいて、Trueの行の別の列の値の平均をとる, 29.PandasからNumpyに変換とその逆, 30.Pandas形式のデータをNumpy形式にする方法, 31.Numpy形式のデータをPandas形式にする方法, 32.要素の頻度(出現回数), 33.ビニング処理(ビン分割),
AI

単回帰分析でScikit-learnに説明変数を準備する際の注意点

Scikit-learnの単回帰分析で説明変数の指定する時の注意点です。 初心者はハマりやすいところですから注意しましょう。 次のサンプルは'G1'(1学期の成績)から単回帰分析を行い'G3'(最終学期)の成績を予測するモデルです。...
スポンサーリンク
タイトルとURLをコピーしました