混同行列と性能評価指標 学習済みモデルが、どの程度良いか判定するする指標を性能評価指標といいます。 そこで登場するのが混同行列です。 混同行列について 余談ですが、普通に「こんどうぎょうれつ」と入力すると「近藤行列」と変換されてしまい、「混同行列」= 「近藤行列」とイメージが刷り込まれているのですが、近藤さんの行列はかなり >>続きを読む
numpy.ndarray型とPandas DataFrame型との相互変換する方法 Scikit-learnで機械学習する場合に、numpy.ndarray型とPandasのDataFrame型をそれぞれ変換したくなるケースがあります。 Scikit-learnが用意しているdatasetを活用するとデータ形式がnumpy.ndarray型になっています。 numpy.ndarra >>続きを読む
Pandasのインポートについて PandasのインポートはPythonのimport文を使うだけです。 import pandas as pd 機械学習を勉強していると時々次のようなインポートが行われています。from import 文を使うと、読み込んだモジュール内の関数にモジュール名をつける必要がなくなります。 import >>続きを読む
Pythonの例外処理について 例外処理とは、エラーが起こりそうな特定のコードが実行された時に、エラーになった場合に例外ハンドラーを準備しとおいて、そのエラーをキャッチする仕組みです。 具体的にはtryブロックに問題が起こりそうなコードを記述しておき、エラーが起こると例外が生成されてexcept ブロックのコードが実行されて何が起 >>続きを読む
SNS対策でOGP設定をする WebサイトでSNS対策をする場合はOGPの設定をしておきましょう。 OGPとは、Open Graph Protocol(オープン・グラフ・プロトコル)のことです。 Facebookやtwitter、などのSNSでシェアされた時に「ページタイトル、URL、内容、画像(サムネイル)」を意図した通りに表 >>続きを読む
Python 〜複数の戻り値(返り値)にタプルやオブジェクトを使う Pythonで関数からの戻り値(返り値)が複数ある場合、最も簡単な方法はタプルで返す方法です。 カンマ区切りで記述をするとPythonではタプルと認識されます。 もちろん、[]をつけてリストを返すこともできます。 つまり、複数の戻り値を作りたい場合は何らかのリスト型の仲間にすれば良いということです。 >>続きを読む
Python〜 join()の使い方 リストで用意されたリストの中の値を文字列として書き出す場合に便利な関数です。 names = ['tahara','yamada','suzuki','yoshida'] としたリストがある場合次のようにします。 res >>続きを読む
BeautifulSoupを使ったスクレイピング(1) BeautifulSoupを使うと簡単にスクレイピングが行えます。 この名前は不思議の国のアリスで出てくる詩からつけられました。 確かに美味しいスープです。 beautifulsoup4の導入 ターミナルなどからpipでインストールします。 pip install beautifulsoup4 Co >>続きを読む
スプレッドシート(エクセルなど)で統計分析(4) 重回帰分析の方法 線形回帰モデル (Linear Regression) とは、回帰式を用いて、説明変数の値から目的変数の値を予測するモデルです。 説明変数が2変数以上の場合「重回帰分析」と呼ばれます。 重回帰分析を行う上でのポイントは「要因分析」と「予測分析」です。単回帰分析では説明変数が1つだけですから、単純に予 >>続きを読む
統計の基礎〜クロス集計2 活用方法 クロス集計を行って、その内容を確認します。 次の例ではA商品とB商品の評価をクロス集計したものです。 原因と結果に何らかの関係が認められる場合、因果関係があるといいます。 因果関係にあるようなクロス集計表は原因になるものを列として、結果を行にします。 統計では原因側の変数を説明変数と呼び、結果側の変 >>続きを読む