機械学習とは|製造業での使い方と実装の現実
機械学習とは|製造業での使い方と実装の現実
この記事を読むとわかること
機械学習はデータからパターンを自動学習するAI技術で、教師あり・教師なし・強化学習の3分類に整理できます。製造業では「予測・分類・異常検知・最適化」が主用途で、機械学習の結果はアルゴリズムでなくデータ品質で決まるというのが現場の鉄則です。AutoMLで民主化が進んでいますが、業務理解とデータ品質判断は依然として人間の仕事です。読み終える頃には、自社のAI導入を検討する際の判断軸が見えてきます。
機械学習の定義と3分類
機械学習(Machine Learning, ML)は、データからパターン・規則性を自動的に学習し、新しいデータに対して予測・判断を行うAI技術です。ルールベースAI(IF-THEN)との違いは、ルールベースが人間がルールを設計するのに対し、機械学習はデータから自動でルールを発見する点にあります。人工知能学会には機械学習の基礎理論と応用研究が蓄積されています。
教師あり学習
正解ラベル付きデータで学習
- 代表アルゴリズムランダムフォレスト、XGBoost、NN
- 製造業の例不良画像判定、需要予測
教師なし学習
ラベルなしでパターン抽出
- 代表アルゴリズムクラスタリング、PCA
- 製造業の例異常検知、顧客セグメント
強化学習
試行錯誤で報酬最大化
- 代表アルゴリズムQ学習、PPO
- 製造業の例ロボット制御、スケジューリング
製造業での4用途とユースケース
製造業での主な用途を整理します。不良判定は教師あり(分類)として外観画像で良品/不良品を判定します。需要予測は教師あり(回帰)として翌月の受注を予測します。故障予測は教師あり/異常検知として設備の故障予兆を捉えます。異常検知は教師なし学習として設備データの異常パターンを検出します。段取り最適化は強化学習/最適化として生産計画の段取り順序を決定します。
機械学習のワークフローは6ステップで進みます。Step 1の課題設定(何を予測/分類するか)、Step 2のデータ収集(学習用データの確保)、Step 3の前処理(クリーニング・特徴量設計)、Step 4のモデル学習(アルゴリズム適用)、Step 5の評価(精度・汎化性能の検証)、Step 6の本番展開(運用と継続的改善)、という流れです。実務的にはStep 1〜3が全体の8割の労力を占めることが多くなっています。
データ品質が結果の上限を決める
「どのアルゴリズムを使うべきか」を聞かれることが多いですが、当社の現場経験では、機械学習の結果の上限はアルゴリズムでなくデータ品質で決まると考えています。
具体的には、ノイズの多いデータでは高精度モデルでも結果が出ません。偏ったデータからは偏った判断が生まれます。少なすぎるデータでは統計的に意味のない結果になってしまいます。「最新のDLモデル」より「データの質と量」が10倍重要というのが、研究現場の常識でもあります。
データ品質を上げる取り組みは地味ですが、機械学習プロジェクトの成否を決める最大の要因です。データ収集体制の整備、欠損値・外れ値の処理、特徴量設計、ラベル品質の検証、こうした工程に労力を割くことが、結果として高い精度につながります。
機械学習が向く問題の3軸判定
機械学習を導入すべき問題か判断する3軸を整理します。第一にパターンがあるかという軸で、データに何らかの規則性があるかを問います。第二にデータはあるかという軸で、学習に十分なデータがあるか(最低数百〜数千件)を問います。第三にルールベースで困難かという軸で、IF-THENで書ききれないほど複雑かを問います。3つすべてYESなら機械学習の候補で、1つでもNOなら他のアプローチを検討するべきです。
機械学習導入の典型的な落とし穴を5つ挙げます。PoCで終わる(モデルを作って満足)、過学習(テストデータには良いが本番で性能が出ない)、データ漏洩(学習データに未来情報が紛れ込む)、解釈性不足(AIの判断理由が説明できず現場が拒否)、継続学習しない(モデルが時間とともに劣化)、これらが繰り返される失敗パターンです。人工知能学会会誌「人工知能」でもこれらの議論が継続されています。対策は「運用込みで設計する」「精度より説明可能性を優先する」の2点に尽きます。
AutoML時代の人とAIの分業
近年、機械学習を民主化するAutoMLツールが普及しています。これにより、データサイエンティスト不在でも一定レベルの機械学習が可能になっています。ただし業務理解・データ品質判断は依然として人間の仕事となります。
中小製造業の現実解としては、データサイエンティストの自社採用は難しい・コスト高という前提のもと、外部パートナーと連携しつつ社内に「機械学習を理解する人」を1人育てるアプローチが現実的です。AutoMLで標準的なモデル構築を効率化し、業務理解と運用設計に人材リソースを集中させる、という分業設計が成立します。
よくある質問
Q1. データサイエンティストを採用すべきか
中小製造業では採用難・コスト高というのが実態です。外部パートナーと連携しつつ社内に「機械学習を理解する人」を1人育てる、というのが現実解です。
Q2. 機械学習の精度はどのくらい必要か
用途次第です。例えば外観検査なら95%以上、需要予測なら80%以上が目安となります。100%を目指す必要はありません。
Q3. クラウドAIと自社実装、どちらか
プロンプトで十分なら汎用クラウドAIで対応可能です。専門的な数理最適化や機密データはオンプレ実装、というハイブリッドが現実解となります。
主な引用元
人工知能学会論文誌(J-STAGE)、人工知能学会 会誌「人工知能」(J-STAGE)、J-STAGE「予知保全のための機械学習」(SCIE)。
Delight Flowでは、機械学習の業務適用検討、PoC設計、運用設計を伴走します。無料診断実施中です。お気軽にご相談ください。
最後までお読みいただきありがとうございました。

執筆者
村田 凌
株式会社Delight Flow 代表取締役CEO
外資系コンサルティングファームにて金融会社のサイバーセキュリティ戦略構築支援に従事した後、東京大学にてAIの研究に取り組む。現在は工学系研究科博士課程に在籍。国際論文誌、学会誌での受賞歴を多数持つ。
会社情報を見る記事の内容について、もっと詳しく聞きたい方へ
AI活用の「最初の一歩」を一緒に考えませんか
月10万円から始められる伴走型のAI顧問サービスです。最低契約期間なし。まずは月1回の壁打ちから。
無料相談・お問い合わせ