申請免費試用、咨詢電話:400-8352-114
zyj
1.數(shù)據(jù)總結(jié)
進行數(shù)據(jù)總結(jié)旨在使數(shù)據(jù)進行精簡,并且給出對這些數(shù)據(jù)的緊湊性描述。數(shù)據(jù)挖掘主要注重從數(shù)據(jù)泛化的角度來討論數(shù)據(jù)總結(jié)。數(shù)據(jù)泛化指的是一種把數(shù)據(jù)庫中的相關數(shù)據(jù)從較低層次抽象到較高層次上的一系列過程。
2.數(shù)據(jù)分類
進行數(shù)據(jù)分類的目的就要是學會一個分類函數(shù)或者分類模型(也稱作分類器),這樣的分類模型可以把數(shù)據(jù)庫的數(shù)據(jù)項映射到給定類別中的某一個。
3.數(shù)據(jù)聚類
數(shù)據(jù)聚類指的是把一組個體按照一定的相似性劃分成若干個類別,也就是所謂的"物以類聚"。數(shù)據(jù)聚類的目的是將屬于同一類型的個體之間的距離盡可能地拉小,并且使得不同類別的個體之間的距離盡可能地拉大。
4.關聯(lián)規(guī)則
關聯(lián)規(guī)則指的是像下面提到的一種規(guī)則,如"在購買面包和黃油的消費者當中,有90%的人同時也買了牛奶"(面包+黃油?牛奶)。關聯(lián)規(guī)則所發(fā)現(xiàn)的思路還可以應用到序列模式的發(fā)現(xiàn)中。顧客在購買商品時,除了具有以上關聯(lián)規(guī)律之外,還會有時間或者序列上的規(guī)律。利用數(shù)據(jù)挖掘工具,企業(yè)可以在冗雜的數(shù)據(jù)中,找到有價值的知識。
|