數(shù)據(jù)分析是指對收集到的大量資料,采用適當?shù)慕y(tǒng)計分析方法,從資料中提取有用的資料,形成結論,對資料進行詳盡的研究和歸納。這個過程也是質(zhì)量管理體系的支撐過程。從實際情況來看,數(shù)據(jù)分析有助于人們做出正確的判斷。下面就讓小編為大家介紹分析數(shù)據(jù)的方法都有哪些?
分析數(shù)據(jù)的方法都有哪些?
描述性統(tǒng)計是一種反映數(shù)據(jù)分布特征的一種統(tǒng)計方法的集合。包括數(shù)據(jù)的頻數(shù)分析、數(shù)據(jù)的集中趨勢分析、數(shù)據(jù)離散度分析、數(shù)據(jù)分布和一些基本的統(tǒng)計圖形等。
缺值填充:目前常用的有剔除、均值、決策樹等方法。正態(tài)性檢驗:許多統(tǒng)計方法都要求數(shù)值服從或近似服從正態(tài)分布,因此在進行數(shù)據(jù)分析前,需要對數(shù)值進行正態(tài)檢驗。一般方法:K量檢驗、P-P圖、Q-Q圖、W檢驗、動差法。
回歸分析是應用非常廣泛的數(shù)據(jù)分析方法之一。該方法根據(jù)觀測數(shù)據(jù)建立相應的變量之間的依賴關系,分析數(shù)據(jù)的內(nèi)在規(guī)律。
1.一元線性分析
只有一個自變量X和一個因變量Y有關,X和Y都必須是連續(xù)變量,因為Y或Y的剩余值必須服從正態(tài)分布。
2.多元線性回歸分析
應用條件:分析多個自變量X和因變量Y之間的關系,X和Y必須是一個連續(xù)變量,因變量Y或它的殘差必須服從正態(tài)分布。
3.邏輯回歸分析
由于變量是離散的,線性回歸模型要求因變量是連續(xù)的正態(tài)分布變量,而且自變量與因變量之間有線性關系,Logistic回歸模型對因變量的分布沒有要求,通常應用于離散情況。
4.其它的回歸方法有:非線性回歸、有序回歸、Probit回歸、加權回歸等。
用途:每個樣本都必須是獨立的隨機樣本;每個樣本都必須是正態(tài)分布的整體;各總體差異相同。
1.單因素方差分析
試驗中僅有一個影響因素,或存在多個影響因素時,僅對其中一個因素和響應變量進行分析。
2.多因素的交互方差分析
一是實驗有多個影響因素,分析多個因素與響應變量的關系,同時考慮多個影響因素之間的關系。
3.多因素無交互方差分析
分析多個影響因素與反應變量的關系,但影響因素之間不影響關系或忽略影響關系。
4.協(xié)方差分
傳統(tǒng)的方差分析方法有明顯缺陷,不能控制分析中的某些隨機因素,降低分析結果的準確性。協(xié)方差分析主要是在排除協(xié)變量影響后,再對修正的主效應進行方差分析,是線性回歸和方差分析相結合的一種分析方法。
20世紀初,數(shù)據(jù)分析的數(shù)學基礎已經(jīng)建立,但是直到計算機的出現(xiàn),使實際操作成為可能,使數(shù)據(jù)分析得以推廣。資料分析是數(shù)學和計算機科學相結合的產(chǎn)物。統(tǒng)計領域,有人把數(shù)據(jù)分析分成描述性統(tǒng)計分析、探索性數(shù)據(jù)分析和驗證性數(shù)據(jù)分析;其中,探索性數(shù)據(jù)分析側重于發(fā)現(xiàn)數(shù)據(jù)中的新特征,而驗證性數(shù)據(jù)分析側重于已有假設的確認或證明。以上就是小編為大家介紹的分析數(shù)據(jù)的方法都有哪些?感謝觀看。
[免責聲明]
文章標題: 分析數(shù)據(jù)的方法都有哪些?
文章內(nèi)容為網(wǎng)站編輯整理發(fā)布,僅供學習與參考,不代表本網(wǎng)站贊同其觀點和對其真實性負責。如涉及作品內(nèi)容、版權和其它問題,請及時溝通。發(fā)送郵件至36dianping@36kr.com,我們會在3個工作日內(nèi)處理。