初期の学習環境
私は、kino-codeさんの動画を参考に、パソコンでの学習環境を整備しました。こちらの「Python入門講座」は、Python の学習環境構築の様々な方法について、Windows、Mac に分けて丁寧に動画と文章で教えてくれます。
以下が私のパソコンのスペックです。3年前に中古で、5万円で購入しました。見て分かるように、高スペックなパソコンは必要ないと思います。
ノートPC: CPU Core i5 MEM 8GB SSD 240GB Windows 10 Pro
Python を使って人工知能を勉強するためには、その環境を作る必要があります。以下に、必要になる可能性があるシステムやライブラリを紹介します。パソコンに詳しくない人には少し敷居が高いですが、kino-codeさんの動画で最低限の環境は構築できると思います。
新・学習環境(2021/1/6 補足)
人工知能の学習が進むにつれて、少し欲がでてきました。もう少し性能の高いパソコンが欲しくなりました。当初は、高価なWindowsのデスクトップPC(高性能グラフィックカード搭載)を考えていました。
グラフィックカードは、ゲームのためではなく、機械学習(人工知能の学習)の計算のためです。カードの種類は(NVIDIAに)限定されますが、機械学習にグラフィックカードのGPUが使えるからです。CPUに比べて、5~10倍の性能アップが期待できるそうです。
実際には、以下のノートパソコンを購入しました。
ノートPC: MacBookPro 13inch M1chip MEM 16GB SSD 256GB BigSur
上記のノートPCを、2021/1/1に注文しました。価格は、税込みで141,800円で、到着までに2週間程かかるそうです。(到着は、2021/1/19)
購入理由は、このパソコンに搭載されたM1チップです。このチップには、
CPU 8uint GPU 8unit Neural Engine 16unit etc.
が搭載されています。つまり、CPUだけでなく、GPUが搭載され、更に、機械学習専用の Neural Engine が搭載されているのです。実際は、機械学習用のソフトウェアが、まだ対応していないので、難しい部分もありますが、非常に強力なことが予想されて楽しみです。これらの取り組みの記録のために、新しいブログを立ち上げました。
<新姉妹ブログ>
・M1で始める機械学習
Google Colaboratory という選択肢
ご存じの方もいると思いますが、Google Colaboratory という無料のクラウドサービスがあります。このサービスは、Jupyter Notebook で作成したファイル(プログラム)を、クラウド上で実行してくれるものです。
ファイルは、Google Drive 上において実行できます。最大の魅力は無料であることと、GPUオプションが使用できることです。私が試したところ、GPUオプションをONにしたことで、20倍近いパフォーマンスを出すことができました。
いつまで無料なのか、大量のファイルを扱うためには、Google Drive への課金が必要かなど、いくつかの懸念材料はありますが、非常に有効なツールであると思います。
<投稿記事>
・Google Colaboratry の GPU による学習の高速化
プログラム開発環境用ライブラリ等
① Anaconda(推奨システム):Python本体を含む、よく使われるライブラリがインストールされます。これだけで基本的な環境構築ができます。
② Visual Studio Code(エディタ):Microsoft のエディタです。Python のコーディングのときに非常に便利です。
③ Jupyter Notebook(システム):Anaconda をインストールすると、一緒にインストールされます。プログラムを対話的に実行することができ、また、コードと一緒に実行結果も印刷できます。
④ Pandas(必須ライブラリ):データ分析の前処理用ライブラリです。データの読み込みや統計量の表示やグラフ化ができます。
⑤ Numpy(必須ライブラリ):データ解析や線形代数を扱う際の数値計算を効率的に行うライブラリです。
⑥ Matplotlib(必須ライブラリ):計算結果をグラフなどの図表で分かりやすく表示できます。
⑦ SciPy(ライブラリ):科学技術計算のライブラリです。Numpy で配列や行列の演算ができます。
⑧ PyQuery(ライブラリ):ネットからデータを引き出す「スクレイピング」用のライブラリです。ネットから情報を取得します。
⑨ BeautifulSoup(ライブラリ):「スクレイピング」用のライブラリです。データの整形に使用されます。
⑩ OpenCV(ライブラリ):画像や動画を処理するためのライブラリです。
人工知能用フレームワーク
① TensorFlow(フレームワーク):Google が開発している、有名なオープンソースライブラリです。ある程度ディープランニングの知識が必要です。
② Keras(フレームワーク):機械学習のアルゴリズムを多く実装し、初心者でも学びやすいライブラリです。
③ Chainer(フレームワーク):自然言語処理や音声処理などによく使われるライブラリです。日本企業が開発し、ニューラルネットワークをシンプルに記述できます。
④ Scikit-learn(フレームワーク):多くの機械学習アルゴリズムが実装されています。Anaconda と一緒にインストールされます。
⑤ DeZero(自作フレームワーク):書籍「ゼロから作る Deep Learning③」~フレームワーク編~、で制作するフレームワークです。
<投稿記事>
・フレームワーク編の学習開始