AI

Python〜matplotlibで描くグラフで日本語を使う方法

matplotlibでグラフを描くときにタイトルなどに日本語を使うと文字化けします。 今回は、Colaboratoryでグラフを描くときの日本語の文字化け対策についてです。 まずは日本語表示できるフォントをColaboratoryにインストールします。 !apt-get -y install fon  >>続きを読む

データスヌーピングバイアス(data snooping bias)について

テストデータの中身を確認してみると、面白さそうなパターンを見つけることができます。これは人間のパターン検出能力の高さでもありますが、これをやってしまうと過学習になる恐れがあります。 特定のパターンのための特定の機械学習モデルを選択すると、推定が楽観的になりすぎて期待通りの性能を発揮できない結果になる  >>続きを読む

Python〜join()の使い方

Pythonの文法では、join()メソッドはsplit()メソッドの逆の使い方として、文字を連結するメソッドと紹介されています。 なんとなくそんなものかと通り過ぎてしまいますが、大切なことはjoin()はリストのメソッドではなく、文字列のメソッドだということです。 「join()は文字列に対して呼  >>続きを読む

Python split()と正規表現で不要なテキストを削除

次のようなコードの意味がわからないと質問がありましたので解説します。 尚、コードのtext内容の文章の一部にある「\」はテキスト内容を見やすくするためにテキスト部分を折り返していますが、エラーが出ないための対策です。 import re text = '霞が関。かつての江戸城の南側にあたり  >>続きを読む

Google Colaboratory 猫モードとかコーギーモードについて

Google Colaboratory の設定メニューに「その他」の項目があります。その中に、ちょっと気になるメニューがあります。 コーギーモード 猫モード とりあえず、チェックを入れたらコーギーモードは犬らしきもの、そして猫モードは猫が上のメニューあたりをうろうろし始めます。 パワーレベル 設定メ  >>続きを読む

Pandasデータからヒストグラムが描けない場合にはnumpyのflatten() を使おう

Pandasデータからある項目をスライスしてその値でヒストグラムを作成するときにうまく行かなくて困ったことがありませんでしょうか。 具体的には次のようなデータがあったとします。 このデータからグレードの列を抜き出してヒストグラムを描くとします。 うまく行く場合 次のようにデータをスライスするとser  >>続きを読む

Pandasのインポートについて

PandasのインポートはPythonのimport文を使うだけです。 import pandas as pd 機械学習を勉強していると時々次のようなインポートが行われています。from import 文を使うと、読み込んだモジュール内の関数にモジュール名をつける必要がなくなります。 import   >>続きを読む

Pythonの例外処理について

例外処理とは、エラーが起こりそうな特定のコードが実行された時に、エラーになった場合に例外ハンドラーを準備しとおいて、そのエラーをキャッチする仕組みです。 具体的にはtryブロックに問題が起こりそうなコードを記述しておき、エラーが起こると例外が生成されてexcept ブロックのコードが実行されて何が起  >>続きを読む

Python〜 join()の使い方

リストで用意されたリストの中の値を文字列として書き出す場合に便利な関数です。 names = ['tahara','yamada','suzuki','yoshida'] としたリストがある場合次のようにします。 res  >>続きを読む