大量、不完全、噪聲、模糊、隨機(jī)地挖掘數(shù)據(jù),發(fā)現(xiàn)隱含著對大數(shù)據(jù)有價(jià)值、潛在有用信息和知識(shí)的過程,也是一個(gè)決策支持過程。數(shù)據(jù)挖掘的基礎(chǔ)是人工智能,機(jī)器學(xué)習(xí),模式學(xué)習(xí),統(tǒng)計(jì)等。接下來小編就為大家介紹介紹數(shù)據(jù)挖掘的四種基本方法,感興趣的話不妨接著看下去吧!
數(shù)據(jù)挖掘的四種基本方法
(1)分類
分類是找出數(shù)據(jù)庫中的一組數(shù)據(jù)對象的共同特點(diǎn)并按照分類模式將其劃分為不同的類,其目的是通過分類模型,將數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到摸個(gè)給定的類別中。可以應(yīng)用到涉及到應(yīng)用分類、趨勢預(yù)測中,如淘寶商鋪將用戶在一段時(shí)間內(nèi)的購買情況劃分成不同的類,根據(jù)情況向用戶推薦關(guān)聯(lián)類的商品,從而增加商鋪的銷售量。
(2)回歸分析
回歸分析反映了數(shù)據(jù)庫中數(shù)據(jù)的屬性值的特性,通過函數(shù)表達(dá)數(shù)據(jù)映射的關(guān)系來發(fā)現(xiàn)屬性值之間的依賴關(guān)系。它可以應(yīng)用到對數(shù)據(jù)序列的預(yù)測及相關(guān)關(guān)系的研究中去。在市場營銷中,回歸分析可以被應(yīng)用到各個(gè)方面。如通過對本季度銷售的回歸分析,對下一季度的銷售趨勢作出預(yù)測并做出針對性的營銷改變。
(3)聚類
聚類類似于分類,但與分類的目的不同,是針對數(shù)據(jù)的相似性和差異性將一組數(shù)據(jù)分為幾個(gè)類別。屬于同一類別的數(shù)據(jù)間的相似性很大,但不同類別之間數(shù)據(jù)的相似性很小,跨類的數(shù)據(jù)關(guān)聯(lián)性很低。
(4)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是隱藏在數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)或相互關(guān)系,即可以根據(jù)一個(gè)數(shù)據(jù)項(xiàng)的出現(xiàn)推導(dǎo)出其他數(shù)據(jù)項(xiàng)的出現(xiàn)。關(guān)聯(lián)規(guī)則的挖掘過程主要包括兩個(gè)階段:第一階段為從海量原始數(shù)據(jù)中找出所有的高頻項(xiàng)目組;第二極端為從這些高頻項(xiàng)目組產(chǎn)生關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘技術(shù)已經(jīng)被廣泛應(yīng)用于金融行業(yè)企業(yè)中用以預(yù)測客戶的需求,各銀行在自己的ATM機(jī)上通過捆綁客戶可能感興趣的信息供用戶了解并獲取相應(yīng)信息來改善自身的營銷。
數(shù)據(jù)挖掘是一種決策支持過程,它通過高度自動(dòng)化地分析企業(yè)的數(shù)據(jù),做出歸納性的推理,減少風(fēng)險(xiǎn),做出正確的決策,這對于一個(gè)企業(yè)的發(fā)展十分重要。以上就是數(shù)據(jù)挖掘的四種基本方法的全部內(nèi)容了,相信大家在閱讀過后應(yīng)該對數(shù)據(jù)挖掘有了基礎(chǔ)的了解了,希望能幫到大家。
[免責(zé)聲明]
文章標(biāo)題: 數(shù)據(jù)挖掘的四種基本方法
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學(xué)習(xí)與參考,不代表本網(wǎng)站贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)溝通。發(fā)送郵件至36dianping@36kr.com,我們會(huì)在3個(gè)工作日內(nèi)處理。