dororo

lecture

Pandasでcsvファイルの読み込みの便利なオプション

Pandasでデータファイルの読み込みができます。csvを始めxlsx形式のものなどかなりの数のデータ形式に対応しています。 その中でも特にcsvファイルの読み込みで知っておくと便利なオプションの紹介です。 Pandasでcsvファイル...
AI

Word2vecをMacで試す〜日本語Wikipediaコーパス活用

日本語のWikipediaの公開データからコーパスを作成する方法はネットでたくさん出回っています。 今回はQiitaの「日本語版WikipediaのデータからWord2Vec用データをつくる(Mac対応)」記事を参考に試す方法です。 大...
AI

決定木の分類結果を可視化する際の書き方が変更(Colabも変更になってます)

決定木の特徴は分類した根拠を説明しやすいことです。 分類の過程をツリー状の図にして書き出すことができます。 その際に次のようにStringIOをimportしていました。 これが次のように変更になっています。最近Colab...
AI

M1チップ搭載MacBook Air Python機械学習系ライブラリインストール結果

M1チップ搭載のMacには機械学習系のライブラリがpipでインストールできない問題があります。 使用したPythonのバージョン:3.8.2(Macにインストールされている3系のバージョン) Anacondaは未導入 HomeBr...
AI

探索的データ解析するときにpandas_profilingを使ってみよう

探索的データ解析をする場合にまずpandas_profilingを使ってみましょう。 きっとあなたを幸せにしてくれると思います。 pandas_profiling Colabで使い方 Colabにはすでにインストールされてい...
Python

Raspberry Pi 4 のはじめ方 2 〜 VNCとの接続でCannot currently show the desktopが出た時の対策

Raspberry Piのセットアップが完了したら使い慣れたPCから遠隔操作できると便利です。 そのためにはVNCを使う方法が簡単です。 VNCの導入方法は「TRASKIT Raspberry Pi 4 のはじめ方」に書いていますの...
lecture

TRASKIT Raspberry Pi 4 のはじめ方

Raspberry Pi(ラズベリー パイ)は、イギリスのラズベリーパイ財団によって開発されたARMプロセッサを搭載したシングルボードコンピュータです。教育用に作成されたものですが、ちょっとした電子工作からプログラミングなど用途は多彩です。...
lecture

整然データ(tidy data)とは

機械学習を行う上でデータの取扱いは重要です。 そこでまず知っておきたいことは、整然データと雑然データの違いです。 整然データ (tidy data)とはハドリー・ウィッカム (Hadley Wickham) 氏が提唱したものです。 ...
Python

Jupyterで処理時間を測定する方法〜Python

Pythonのコードに慣れてきたら、処理時間が気になってきます。 Jupyter labやColabを使っている場合はマジックコマンドで簡単に処理時間を計測することができます。 マジックコマンドで処理時間を測定する場合はtimeやt...
lecture

Python 統計〜NumpyとPandasでは分散 var() と標準偏差 std() のデフォルト値が違う

分散と不偏分散について 統計ばかりではなく、機械学習でもで分散や標準偏差は重要な指標になります。 PythonのライブラリでNumpyやPandasのメソッドを使うと簡単に分散や標準偏差の値を求めることができます。 NumpyとPan...
スポンサーリンク
タイトルとURLをコピーしました