數(shù)據(jù)分析只是在已定的假設(shè)中處理原有的計(jì)算方法和統(tǒng)計(jì)方法,將數(shù)據(jù)分析轉(zhuǎn)化為信息,認(rèn)知,轉(zhuǎn)化為有效的預(yù)測(cè)和決策。這時(shí)候就需要數(shù)據(jù)挖掘,也就是我們數(shù)據(jù)分析師系統(tǒng)成長之路的上一層。下面就讓小編為大家介紹數(shù)據(jù)挖掘與數(shù)據(jù)分析的區(qū)別。
數(shù)據(jù)挖掘與數(shù)據(jù)分析的區(qū)別
1,數(shù)據(jù)分析(狹義):
(1)定義:簡單來說,數(shù)據(jù)分析就是對(duì)數(shù)據(jù)進(jìn)行分析。專業(yè)的說法,數(shù)據(jù)分析是指根據(jù)分析目的,用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法及工具,對(duì)收集來的數(shù)據(jù)進(jìn)行處理與分析,提取有價(jià)值的信息,發(fā)揮數(shù)據(jù)的作用。
(2)作用:它主要實(shí)現(xiàn)三大作用:現(xiàn)狀分析、原因分析、預(yù)測(cè)分析(定量)。數(shù)據(jù)分析的目標(biāo)明確,先做假設(shè),然后通過數(shù)據(jù)分析來驗(yàn)證假設(shè)是否正確,從而得到相應(yīng)的結(jié)論。
(3)方法:主要采用對(duì)比分析、分組分析、交叉分析、回歸分析等常用分析方法;
(4)結(jié)果:數(shù)據(jù)分析一般都是得到一個(gè)指標(biāo)統(tǒng)計(jì)量結(jié)果,如總和、平均值等,這些指標(biāo)數(shù)據(jù)都需要與業(yè)務(wù)結(jié)合進(jìn)行解讀,才能發(fā)揮出數(shù)據(jù)的價(jià)值與作用;
2,數(shù)據(jù)挖掘
(1)定義:數(shù)據(jù)挖掘是指從大量的數(shù)據(jù)中,通過統(tǒng)計(jì)學(xué)、人工智能、機(jī)器學(xué)習(xí)等方法,挖掘出未知的、且有價(jià)值的信息和知識(shí)的過程。
(2)作用:數(shù)據(jù)挖掘主要側(cè)重解決四類問題:分類、聚類、關(guān)聯(lián)和預(yù)測(cè)(定量、定性),數(shù)據(jù)挖掘的重點(diǎn)在尋找未知的模式與規(guī)律;如我們常說的數(shù)據(jù)挖掘案例:啤酒與尿布、安全套與巧克力等,這就是事先未知的,但又是非常有價(jià)值的信息;
(3)方法:主要采用決策樹、神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián)規(guī)則、聚類分析等統(tǒng)計(jì)學(xué)、人工智能、機(jī)器學(xué)習(xí)等方法進(jìn)行挖掘;
(4)結(jié)果:輸出模型或規(guī)則,并且可相應(yīng)得到模型得分或標(biāo)簽,模型得分如流失概率值、總和得分、相似度、預(yù)測(cè)值等,標(biāo)簽如高中低價(jià)值用戶、流失與非流失、信用優(yōu)良中差等。
數(shù)據(jù)挖掘與數(shù)據(jù)分析緊密相連,具有循環(huán)遞歸的關(guān)系。數(shù)據(jù)分析結(jié)果需要進(jìn)一步的數(shù)據(jù)挖掘來指導(dǎo)決策,數(shù)據(jù)挖掘的價(jià)值評(píng)估過程需要調(diào)整先驗(yàn)約束,然后再進(jìn)行數(shù)據(jù)分析。以上就是小編為大家分享的數(shù)據(jù)挖掘與數(shù)據(jù)分析的區(qū)別,希望本章內(nèi)容對(duì)大家有所幫助。
[免責(zé)聲明]
文章標(biāo)題: 數(shù)據(jù)挖掘與數(shù)據(jù)分析的區(qū)別
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學(xué)習(xí)與參考,不代表本網(wǎng)站贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。如涉及作品內(nèi)容、版權(quán)和其它問題,請(qǐng)及時(shí)溝通。發(fā)送郵件至36dianping@36kr.com,我們會(huì)在3個(gè)工作日內(nèi)處理。