IT工房 ブログ

統計の基礎〜偏差、平均偏差、標準偏差、分散、標準化、偏差値について

データのバラツキで出てくる言葉で、「偏差」、「平均偏差」「標準偏差」、「分散」とは何を行っているのか復習です。 データのバラツキを見るときにまず基準になるのは、平均です。 平均との関係を視点にして見ていくとわかりやすいと思います。 偏差 偏差はある値と各値の平均との差のことです。 偏差の値はマイナス  >>続きを読む

z-indexこうすれば思い通り動く〜ネットや入門書では誤解を生む説明が多いので注意!

HTMLとCSSのレイアウトで親要素の裏側に子要素を移動したい。つまり親子間での重ね順を変える場合どうしてますか? positionプロパティとz-indexプロパティを使って移動させるはずです。 でも、なかなか思い通りに動いてくれないはずです。 もしかしたら、親要素に 「z-index:0」 とし  >>続きを読む

散布図と回帰直線を簡単に描く方法

回帰分析で散布図を描く時、通常は matplotlib を使うと思いますが、seaborn を使うともっと楽に描くことができます。 matplotlib を使った散布図 import pandas as pd import matplotlib.pyplot as plt df = pd.read_  >>続きを読む

スプレッドシート(エクセルなど)とPythonで統計分析(3) scikit-learn で単回帰分析の方法

今回はscikit-learn で単回帰分析する方法について解説します。 分析対象は「スプレッドシート(エクセル)とPythonで統計分析(2) 単回帰分析の方法」で行った「1日の最高気温とアイスクリームの販売個数」のデータを使います。 スプレッドシートで単回帰分析を行う方法は「スプレッドシート(エ  >>続きを読む

最小二乗法で傾きを求める方法を数学的に理解しよう

回帰直線の傾きは公式で簡単に求められますが、数学的な意味を理解しておくとなぜそうなるかがわかります。今回は数学的な意味を見ていきます。 問題設定:最高気温とアイスクリーム販売数のデータを用いて、今日の気温予報からアイスクリーム販売予測を行う。 データ 最高気温 (℃) アイスクリーム販売数 (個数)  >>続きを読む

スプレッドシート(エクセル)とPythonで統計分析(2) 単回帰分析の方法

単回帰分析 単回帰分析とは、以下のような回帰式を用いて、1つの説明変数の値から目的変数の値を予測するモデルです。 単回帰分析の公式 $$ y = ax + b $$ データの準備 用意したデータはある店舗における1日の最高気温とアイスクリーム購入数です。 (注)データの数値は架空の数値です。 最高気  >>続きを読む

pandasで同じ値の個数を調べる方法

pandasで1次元の配列状態のデータを処理するにはSeriesを使います。下の例では配列を作成して、pandasのseriesにしています。 次に条件として値が2のデータのみを抽出してその総個数を求めています。 複数の条件の結果をまとめて求めるにはループ文を使用します。下の例では1から43までの数  >>続きを読む

コマンド引数で住所を指定するとGoogle Mapが開く〜Python

Pythonで簡単なアプリの例です。 ネタ元はO’REILLYの「退屈なことはPythonにやらせよう」からです。 この本はノンプログラマーにもわかりやすく書かれている良本です。他に何らかプログラム入門くらい経験し、プログラムが面白いと思う人には参考になります。 けれども、プログラム入門  >>続きを読む

ColaboratoryとGoogle ドライブをマウントする方法

2019年07月6日追記 ColaboratoryとGoogle ドライブをマウントについては、標準でその機能がつきました。 やっていることは下記同様のこととなりますが、より直感的にマウントできるようになっています。 GoogleのColaboratoryは機械学習など学習する上で大変便利なクラウ  >>続きを読む

Visual Studio CodeでEmmetのlang属性を変更する方法〜なぜか変更できなかったら試して!

Visual Studio CodeでEmmetを使って一発でHTML基本構文を書き出せますが、初期状態ではlang属性が「en」になっています。 この初期状態を「ja」にする方法はネットに多く出回っていますが、なぜか自分はうまくいかないと諦めていませんか? 実はうまくいっているのですが、落とし穴に  >>続きを読む