ブログ SUNM Tech & Business Blog

⌚ 2022/12/13 (Tue) 🔄 2022/12/13 (Tue)

機械学習とは何か?これだけは知っておきたい3つの学習方法と事例について大解説

機械学習とは何か?これだけは知っておきたい3つの学習方法と事例について大解説
最新技術

顔認証技術、異常検知など、最近様々な技術に応用される機械学習。
その機械学習について深堀しています。
「機械学習」は、教師あり学習、教師なし学習、強化学習の大きく三つに分類でき、それぞれについて詳しく解説しています。
ここまでで頭の中に「?」が浮かんだ方も大丈夫です。

この記事を読み進めると誰でも、「機械学習とは何か。」を理解できるようになります。

記事では、抽象的な概念だけでなく、概要とメリット・デメリットに合わせて実際に利用された事例を分かりやすくまとめています。

  • 機械学習を勉強し始めた社会人
  • 機械学習の事例を知りたい方
  • 機械学習の種類やそれぞれのメリット・デメリットについて知りたい方

▼この記事を書いた人
サン・エム・システム入社1年目のひよっこ社員。脳をディープラーニングしたいと思い、データ分析のチームに参画し、日々データ分析を学習しています。

1.機械学習について

「機械学習」

この言葉が産声をあげたのは、意外にも古く1956年です。
丁度、日本の高度経済成長期の時に、機械学習が誕生しました。
そして10年、20年、30年...と時を経て、2000年代に一気に注目を浴び始めました。
以下の技術を皆さん一度は聞いたことがあるのではないでしょうか?

・農家の生産量予測
・店舗の来客分析
・コールセンターの自動化
・人物の顔認証技術力

これらの技術は全て「機械学習」を用いて実現されています。
今や触れない日はないほど機械学習は日常に溶け込んでいます。
しかし、身近になる一方で、その実態は遠のいていきます。

実際に

「機械学習とは何か。」

を知っている方は少ないはずです。(少ないのではないでしょうか。)

機械学習の技術が進歩すればするほど、私たちの暮らしはより豊かになる。
しかし、機械学習はさらに高度で複雑になり、曖昧模糊とした存在になっていく―。

そこで今回、そんな理解が難しい「機械学習」について実際にイメージをしやすい言葉を用いて分かりやすくお話します。
気になる方は是非ご覧ください。

2.機械学習の分類

機械学習の分類.png

「機械学習」は人工知能の中の分析手法の1つです。
「人工知能」は人間の知能を模したシステム、世の中の暮らしを便利にするためのシステムです。
その人工知能の中でも、
機械学習」は入力されたデータを蓄積し、そのデータを学習に使用することで、より高い精度の予測を可能とする「データ分析技術」です。

機械学習における入力データは、「学習データ」や「訓練データ」と呼ばれます。
顧客の購買状況を学習データとして在庫の予測をしたり、プロのチェスの対戦記録を訓練データとして性能を高めたり、(と言ったように、)入力されたデータを活用し分析することで、精度の高い予測を可能とします。

「機械学習」の方法は3つに大別することができます。

・教師あり学習
・教師なし学習
・強化学習

ここから、これら1つ1つについてしっかり説明していきますので、詳しく見ていきましょう。

3.教師あり学習

教師あり学習とは?.png

3-1.「教師あり学習」とは?

「教師あり学習」は入力データにあらかじめ正解・不正解(教師からの助言)を与え、データを分析する機械学習です。
データに正解・不正解を与えることで効率良く、より正確にデータを予測することができます。

例えば画像データに対して

1が記載された画像→「これは"1"ですよ」
2が記載された画像→「これは"2"ですよ」

と正解を与え学習させます。

正解を与えることで画像における"1"と"2"の特徴を効率良く把握でき、また誤った予測を防ぎます。
このように正解を事前に与えることで、学習の精度を高めることができます。これが「教師あり学習」です。
入力データに正解・不正解を付与し学習に役立てる。このような特徴から、
予め正解が存在する分野で大きな力を発揮します
よく耳にする「ディープラーニング」も教師あり学習の一種です。

3-2.「教師あり学習」のメリット・デメリット

メリット

・正解データを学習するため、効率が良い
・データの質を向上させることで精度も高くなる

デメリット

・正解データの質が悪いと予測の精度が下がる
・正解が存在しない分野に利用できない

3-3.事例紹介

「教師あり学習」は機械翻訳に活用されています。
機械翻訳とは、言語の翻訳をコンピュータが行う技術です。身近な例としてGoogle翻訳やDeepL翻訳などが挙げられます。
英文の和訳、或いは日本語の英訳などは、正解が予め決まっているため、データの準備にコストを割くことなく機械翻訳を実現できます。
Web上で動作するGoogle翻訳は、世界中の人々が利用し、それが学習データとして蓄積されるため、正解データが大量にあり、非常に高性能な機械翻訳となっています。

4.教師なし学習

教師なし学習とは?

4-1.「教師なし学習」とは?

「教師なし学習」は「教師あり学習」とは違い、
事前に正解・不正解を与えずにデータを分析する機械学習です。
正解のないデータのため、機械は自力でデータを分析する必要があります。不要な情報の削除を繰り返し、必要なデータを抽出します。
それにより、データの背後に存在する本質的な構造を抜き出します。
例えば、学校のテストで国語80点、英語90点、理科60点、数学45点という成績の学生がいたとします。
この学生は「文系科目が得意な学生」と見ることができますよね。
この例のように、データの次元を削減し、本質を見つけ出すのが「教師なし学習」です。
予め正解のある「教師あり学習」と違い、
正解のない問題を予測することが得意です。

4-2.「教師なし学習」のメリット・デメリット

メリット

・前もって正解データを用意する必要がない
・人間が想像もしなかった本質を発見できる場合がある

デメリット

・「教師あり学習」に比べ精度が低い
・導き出した分析が実用上役に立たないことがある

4-3.事例紹介

「異常検知」は、通常とは違う振る舞いをした際に、それを異常として検出する機能です。
例えば、キャッシュカード。
「いつもならATMで3万円固定で出金しているが、何故かこの日だけ4630万円出金している。これはおかしい。」と異常検知システムが判断し、使用者に知らせます。
このように、通常のルーティーンを入力データとして蓄積することで、日々の行動を浮き彫りにし、特徴を理解し予測することができます。
異常検知は最近(2022年現在)ではApplewatchの転倒検知などで話題となっています。

5.強化学習

強化学習とは?

5-1.「強化学習」とは?

「強化学習」は、コンピュータシステムが自主的にトライアンドエラーを行い、正解や目標に近づいたら報酬を与える機械学習です。
「教師あり学習」や「教師なし学習」と違い、一回一回の行動を評価し、それを繰り返すことで、行動を最適化していきます。

例えば、Web広告は、ウェブ閲覧者の情報を読み取り、その閲覧者の好みに合わせてPR広告を表示します。
その際に、どのくらい広告がクリックされたか、どのくらい商品が成約されたか、などの情報を得ます。
その情報を基に別の閲覧者に広告を打ち出し、またその結果から他の閲覧者に...、といったように「行動に対し評価を行い、その評価から次回の行動の最適解を見つける」ということを繰り返します。

5-2.強化学習のメリット・デメリット

メリット

・未知の環境に適応できる
・評価尺度の定義が困難な問題も扱うことが可能

デメリット

・学習に膨大な時間がかかる
・人間が意図しない挙動をする可能性がある

5-3.事例紹介

強化学習の事例として最も有名なのは囲碁プログラムAlphaGo(アルファ碁)です。

2015年にプロ囲碁棋士を破ったのは皆様の記憶にも残っているのではないでしょうか?
囲碁の局面は約2×10^172通りとボードゲームの中でも郡を抜いており、
創造性と戦略性が強く問われるゲームです。
「AIは囲碁では人間に勝てない」と言われていた中で、人間に勝利したAlphaGo(アルファ碁)は一躍有名になりました。

そんなAlphaGoは「強化学習プログラム」を採用しています。
何度も対戦して試行錯誤することで最適化を行い、精度を高めていきましたそして、
ついには人間をも超えてしまったのです。
「強化学習」は評価尺度が困難な問題を扱うことができるため、多くの事象にコミットすることができます。

この記事のまとめ

【梅本】機械学習とは何か?種類や事例について解説_6.png

ご覧いただきありがとうございました。
ここまで読んで頂き、「機械学習とは何か」の理解の手助けになりましたか?
この記事では機械学習の概要、3つの分類についてご紹介しました。
3つの機械学習のイメージを分かりやすくお伝えすると、

・教師あり学習→教師からの教えを忠実に守り学習する優等生
・教師なし学習→自室にこもり黙々と研究を続ける研究生
・強化学習→走り転び立ち上がり、トライアンドエラーを繰り返しながら成長する部活生

上記のイメージです。まずはこのイメージを頭に染み込ませると、理解しやすいのではないでしょうか

弊社、サン・エム・システム株式会社はデータ分析の分野に明るい人材が多いです。
データ分析に関するプロダクトを提供していますので、ご興味のある方は是非こちらをご確認ください。

導入事例:拡張を続けるサービスからの膨大なデータを処理するフレキシブルな分析基盤を構築

参考

TRYETING/AI(人工知能)の歴史は60年以上?歴史の流れとこれからの未来を解説
NTT東日本/教師あり学習とは?覚えておきたい機械学習の学習手法概要

問い合わせ

お申し込みはこちら.png

サン・エム・システム サービス

詳しくはこちら(OneStopCloud).png 詳しくはこちら(PowerApps).png 詳しくはこちら(power-automate-desktop).png 詳しくはこちら(Inc-Resu).png