データマイニング

データマイニングとは

データマイニングは、翻訳がデータマイニングであるコンピュータサイエンスにリンクされた英語の用語です。 それは、 データ集約して整理し 、それらの中から関連するパターン関連性変化および異常性を見つける機能性からなる。

データマイニングという用語は、1990年にデータベースコミュニティで初めて登場しました。 データマイニングは、KDD( データベース内の知識発見 )として知られるプロセス分析ステップであり、その文字通りの翻訳は「データベース内の知識発見」です。

データマイニングは、探査、モデル構築、パターン定義、検証と検証という、いくつかの基本的なステップに分けることができます。

データマイニングは、コンピューティングの世界では比較的最近の慣習であり、情報検索、人工知能、パターン認識、および統計手法を使用して、企業または個人にとって有益な知識を得ることができるさまざまなデータ間の相関関係を検索します。 企業にとって、 データマイニングはイノベーションと収益性を向上させる重要なツールとなります。

データマイニングの使用は大規模データベースでは非常に一般的であり、それらの使用の最終結果は規則、仮説、決定木、樹状図などを通して表示することができます。

適切に実行されたデータマイニングは、異常検出、連想ルール学習(依存関係モデリング)、 クラスタリング 、分類、回帰、要約などのタスクを実行する必要があります。 データマイニングプロセスは通常、 データウェアハウス内に含まれるデータを使用して行われます。

データベース内のパターンの識別がますます重要になるため、データマイニング専用の企業やソフトウェアがいくつかあります。 しかしながら、関連規格の識別はコンピュータの世界に固有のものではありません。 人間の脳は、パターンを識別し知識を習得するために同様のプロセスを使います。

近年、データマイニングは、バイオインフォマティクス、遺伝学、医学、教育、電気工学などの科学および工学の分野で広く使用されています。

データマイニングの概念は、多くの場合、人々の行動に関する情報の抽出に関連しています。 このため、状況によっては、データマイニングによって法的な問題やプライバシーと倫理に関する問題が発生することがあります。 それにもかかわらず、データマイニングは倫理的な意味を持たないため倫理的に中立であると多くの人が主張しています。

データマイニングの

データマイニングは、ユーザー/従業員/顧客に関する知識を習得するために企業や組織でよく使用されます。 たとえば、公共部門では、従業員の婚姻状況と彼が稼いだ給与とを照合して、これが婚姻生活に影響を与えるかどうかを確認することができます。

スーパーマーケットチェーンなどの企業は、このクロスデータを使用して、一緒に購入された商品を特定できます。 商品Xを購入する顧客が商品Yも購入する場合、顧客が購入しやすいように2つの商品を近くに配置することをお勧めします。