EXCEL是進行數據處理、分析的基本工具,從各個公司招聘[數據分析師]的職位要求不難發現,作為數據分析師,熟練掌握EXCEL是必不可少的技能之一。在數據分析過程中,通過Excel可以實現數據清洗、數據分析、數據可視化等功能,那么具體應該怎么使用呢?接下來就由小編為您介紹數據統計與分析,如何進行數據統計與分析。
數據統計與分析
數據清理(Datacleaning)是一種對數據進行重新檢查和檢查的過程,其目的在于消除重復信息,糾正現有的錯誤,并提供數據一致性。
通常從以下7個方面進行數據審核。(文字做簡單說明,具體操作方法見圖內圖。)
Selection子集:隱藏原始數據集字段意義相似和數據無用的列,只保留可用的分析數據列。
列名稱重命名:確保列名準確地描述了數據集的含義(可以根據行業/公司對數據集含義的理解命名)。
移除重復項:選擇一個數據集數據字段內容具有唯一性的列,以此作為檢查重復項的基準。
丟失的值處理:選取字段數據完整的列統計計數值(整個選擇列之后,計數結果會自動顯示在表格右下角),其他字段都將此作為統計缺失值的標準。使用查找→定位“null值”來鎖定空值位置。處理空值,與實際情況相結合(人工輸入/平均替代/統計模型輸入/刪除)
一致性處理:確保每個字段都以數字的方式表示,并可計算。第一,通常需要對合并域的內容進行分類;第二,對原有字段數據進行簡單公式計算(average,sum,max,min,if,countif,date),將原來的字段數據按簡單公式計算(average,sum,max,min,if,countif,date)。最終,過濾后增加的字段檢查是否存在錯誤值,完成對錯誤值的處理。
遞減順序:按某一領域的遞增/降序排列。
離群值處理:用數據透視表對數據分類匯總發現異常值,利用函數公式(IF+COUNT+FIND)區分異常項,篩選出異常項。
利用清洗后的數據,根據業務問題尋找目標,進行數據分類匯總,描述性統計分析,多表關聯分析。
資料分類匯總【資料透視表】:利用資料透視表功可實現資料分類呈現,并可按需設定分類后的資料匯總方式,加總/平均數/最大值等。
分析工具庫的描述性統計分析:裝入“分析工具庫”后,選擇“數據-數據分析-描述分析”。
多表關聯分析:兩個表的數據字段有相同的含義,VLOOKUP可以實現對匹配數據的跨表格的精確查找;另外,使用該函數可以實現數據按條件分組,首先定義分組規則(臨界值、分組名稱、分組范圍),將近似查找返回值作為對應組名。
隨著社會經濟的發展,各類企業不斷壯大,小型企業不斷涌現,數據分析日益重要。許多畢業生,相關行業的從業人員或者想要轉行的人開始考慮數據分析行業,大家紛紛在平臺上提出各種問題,比如,數據分析是什么?如何進入數據分析員的零基礎等等,其實數據分析入門比較簡單,只要學會使用軟件就能算粗淺的入門。以上就是小編為您帶來的數據統計與分析,如何進行數據統計與分析。
[免責聲明]
文章標題: 數據統計與分析,如何進行數據統計與分析
文章內容為網站編輯整理發布,僅供學習與參考,不代表本網站贊同其觀點和對其真實性負責。如涉及作品內容、版權和其它問題,請及時溝通。發送郵件至36dianping@36kr.com,我們會在3個工作日內處理。