機械学習の現在地
環境としては、GeForceを載せたWindowsノートパソコンを購入しましたが、まだ一度もGPUは本気を出していません。一度も。
スッキリわかるPythonによる機械学習入門
本はこれを読んだ。
データ分析のことがわかりやすく書いてあった。
欠損を埋めるとか、次元削減とか、実践はしていないので手ごたえはないんだけど、概念としては「なるほどそういうことか」というのはぼんやりわかった。
たぶんこういう前処理とか、適当な分析方法の提案みたいなものを決まった手続きで、今よりも知識の少ない一般人にも実行できるような、仕組みを上の方では作ろうとしているのだろうなと思った。
そういうデータ分析のパッケージ商品みたいなものがどんどんでてくるんじゃないかと思った。
タイタニック問題には挑戦してみたいと思う。
—
ぼくの場合は、データ分析が仕事になることはおそらくないと思う。
分析すべきデータを持っているようなちゃんとしたというか、それなりの規模の会社とは取り引きしないと思うので。
ぼくの学習の方向としては、yoloみたいな、すでに誰かが作ったフレームワークとかライブラリを組み合わせて便利ツールを作れるようになるというところだと思っている。
そういうライブラリみたいなものを自分で作れるようになる必要はなくて、技術のトレンドを1年遅れぐらいでもいいので追いかけて、実際に使ってみて商品になるかどうかを考える。
商品というのも、きちんとしたパッケージのようなものではなく、ものすごく不完全なプロトタイプみたいなものでよくて、はったりというか看板で良い。
そういうものはどんどん商品化されて、たとえば物体検出機能付きカメラみたいなものがどんどん安く出てくるとは思うのだけど、それでも目の前のお客さん専用に学習データを作ったりしてしばらくは売り物になるのではないかと思う。
—
ただ、トレンドを追うにしても前提知識みたいなものが不足していてとても効率が悪い。
tensorflowとかpytorchとかが、どの部分を担っているのかとか、機械学習の土台のところがぼんやりしていて自分がなにをやっているのかがわからない感じがする。
—
興味対象としては、画像分析と文章の解析と生成。チャットボットとか、ゲームの人工知能的な表現ができるものも作ってみたい。
画像分析は物体検出ができれば、たとえばお店の前の看板の前で立ち止まって看板を見てる人の数と属性とかが集計できれば商品になりそうだなと思う。
そういう既製品がでるとすると看板にカメラがついてるとかになると思うのだけど「カメラがついてる看板なんかは不気味なのでやっぱり店の中にあるカメラでこっそり解析したいな」っていう流れになってくれると我々ゲリラ部隊の出番になるんじゃないかと思う。
文章の生成は、GPT-3みたいなすさまじいことはできないけど、いったん文章を最小限の要素に削いでプログラミング言語みたいなものに変換して、それを解析するなら解析して、出力する時に装飾するとかそういうのができればいいなと思った。文章の「データの前処理」というのはいろいろ工夫しがいがあっておもしろそうな気がする。もうみんなとっくにやっとるんやと思うけど。
結局一番の興味は、人工知能というものなのだと思う。きっと、昔から自分の意思を持ったコンピューターというものに憧れているのだと思う。めちゃエキサイティング。