申請免費試用、咨詢電話:400-8352-114
zyj
1.數據總結
進行數據總結旨在使數據進行精簡,并且給出對這些數據的緊湊性描述。數據挖掘主要注重從數據泛化的角度來討論數據總結。數據泛化指的是一種把數據庫中的相關數據從較低層次抽象到較高層次上的一系列過程。
2.數據分類
進行數據分類的目的就要是學會一個分類函數或者分類模型(也稱作分類器),這樣的分類模型可以把數據庫的數據項映射到給定類別中的某一個。
3.數據聚類
數據聚類指的是把一組個體按照一定的相似性劃分成若干個類別,也就是所謂的"物以類聚"。數據聚類的目的是將屬于同一類型的個體之間的距離盡可能地拉小,并且使得不同類別的個體之間的距離盡可能地拉大。
4.關聯規(guī)則
關聯規(guī)則指的是像下面提到的一種規(guī)則,如"在購買面包和黃油的消費者當中,有90%的人同時也買了牛奶"(面包+黃油?牛奶)。關聯規(guī)則所發(fā)現的思路還可以應用到序列模式的發(fā)現中。顧客在購買商品時,除了具有以上關聯規(guī)律之外,還會有時間或者序列上的規(guī)律。利用數據挖掘工具,企業(yè)可以在冗雜的數據中,找到有價值的知識。
|