2020-08-06
の基本概念 フードマシン データサイエンスの学習には、コンピューターがデータセットを分析し、パターンを識別できる統計学習と最適化方法を使用することが含まれます(R2D3外部リンクを介して機械学習の視覚を表示します)。機械学習技術は、データマイニングを活用して、歴史的傾向を特定して将来のモデルを知らせます。
典型的な監視された機械学習アルゴリズムは、(ほぼ)3つのコンポーネントで構成されています。
決定プロセス:データを取得し、アルゴリズムが検索したいデータの種類のパターンで「推測」を返す計算のレシピまたはその他の手順。
エラー関数:推測を既知の例(利用可能な場合)と比較することで、推測がどれほど良かったかを測定する方法。決定プロセスはそれを正しくしましたか?そうでない場合、ミスはどのように「どれほど悪い」と定量化しますか?
更新または最適化プロセス:アルゴリズムがミスを調べてから、決定プロセスが最終決定にどのように来るかを更新して、次回ミスがそれほど大きくならないようにします。
たとえば、映画の推奨を構築している場合、アルゴリズムの決定プロセスは、特定の映画があなたが見た他の映画にどれほど似ているかを調べ、さまざまな機能のために重み付けシステムを考え出すかもしれません。
トレーニングプロセス中、アルゴリズムは視聴した映画を通過し、さまざまなプロパティを重み付けします。それはSF映画ですか?面白いですか?その後、アルゴリズムは、あなた(またはあなたのような人)が実際に見た映画を推奨することになるかどうかをテストします。それが正しくなった場合、使用したウェイトは同じままです。映画が間違っている場合、間違った決定につながった重みが断られてしまうので、そのような間違いを再び起こさないようにします。
機械学習アルゴリズムは自律的に更新されるため、分析するデータから教えるため、分析の精度は各実行とともに向上します。学習のこの反復的な性質は、人間の介入なしで発生するため、特にプログラムされることなく隠された洞察を明らかにする能力を提供するため、ユニークで価値があります。
私たちの製品に興味があるなら、にアクセスしてください / .