愛鋒貝

 找回密碼
 立即注冊

只需一步,快速開始

扫一扫,极速登录

查看: 731|回復(fù): 0
打印 上一主題 下一主題
收起左側(cè)

數(shù)據(jù)分析第2篇|深入理解:探究四種常見的數(shù)據(jù)分析類型

[復(fù)制鏈接]

1466

主題

1535

帖子

6017

積分

Rank: 8Rank: 8

跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2023-4-3 06:33:15 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式

一鍵注冊,加入手機圈

您需要 登錄 才可以下載或查看,沒有帳號?立即注冊   

x


在【數(shù)據(jù)分析第一篇|概念掃盲】,通過三個故事簡單給大家掃盲了一下數(shù)據(jù)分析的概念,讓你可以快速理解數(shù)據(jù)分析的本質(zhì)。但真實的數(shù)據(jù)分析肯定是要復(fù)雜的多。
?我們提到數(shù)據(jù)分析就是從數(shù)據(jù)中提取有價值的信息的過程,目的是用于決策。數(shù)據(jù)分析是一個過程,是一個我們通過數(shù)據(jù)理解世界的一個過程。
在劉慈欣的科幻小說《三體》中,智子是一種超級人工智能,其能力和智慧遠超人類。故事中三體人通過智子 鎖死了人類科技。
其鎖死人類科技的核心就是在微觀層面干擾人類科學(xué)實結(jié)果,從而使人類科學(xué)家不能正確地開展數(shù)據(jù)分析,無法對物質(zhì)深層的結(jié)構(gòu)進行有效探索,失去了理解世界的能力,從而無法產(chǎn)生突破性的科學(xué)發(fā)展。
由此可見數(shù)據(jù)分析的重要性。這篇文章,我們就來聊一聊數(shù)據(jù)分析的四種類型,了解一下如何利用數(shù)據(jù)來幫助我們更好地理解世界。
第一類:描述型數(shù)據(jù)分析

我們都知道,所謂的數(shù)據(jù)是對事實的描述,比如說你的身高、體重、籍貫等等。對這些數(shù)據(jù)的描述本身也是一種分析。
舉一個例子:最近我在看房子,每天會關(guān)注成都市二手房的成交量,比如說{2023年2月27日成都二手房成交了465套}
這就是描述型分析,如果你寫過實證分析相關(guān)的論文,這個就是對數(shù)據(jù)的描述,比如說我上面提到的畢業(yè)論文,在完成數(shù)據(jù)處理后會做一個描述型統(tǒng)計分析:
2012年,國有企業(yè)控制下的上市公司數(shù)量達到了1176家,占比超過50%,到2016年,這個數(shù)字下降到了1015家,占比降至不到50%。與此同時,民營企業(yè)控制下的上市公司數(shù)量在同期內(nèi)從978家增加到了1183家……
第二類:探索性數(shù)據(jù)分析

探索性數(shù)據(jù)分析,有個英文名叫Exploratory Data Analysis,簡稱EDA。我們所說的一般意義上的數(shù)據(jù)分析就是指探索性分析。
所謂的探索性分析就是提出一個問題,然后通過數(shù)據(jù)的特征、規(guī)律、分布和異常等情況,給出問題的答案,輔助決策。
這也是一般企業(yè)里數(shù)據(jù)分析師的核心工作:比如說探究什么用戶注冊數(shù)變少了?為什么公司的GMV下滑了?等用戶運營或者產(chǎn)品運營層面的問題。
講一個故事:
2021年我在一家公司金融小貸部門做數(shù)據(jù)產(chǎn)品經(jīng)理,主要做貸前的反欺詐產(chǎn)品。
有一天運營部門的同事突然發(fā)現(xiàn),當(dāng)天下午的3點-6點,申請貸款的用戶暴增,而且比過往的每天平均客戶數(shù)多了2倍多,而且還在持續(xù)增長,于是立刻匯報給了部門領(lǐng)導(dǎo).
部門領(lǐng)導(dǎo)就給數(shù)據(jù)分析的同事拋出來一個問題:是什么原因?qū)е掠脩魯?shù)驟增?
數(shù)據(jù)分析的同學(xué)接到任務(wù),立刻著手進行數(shù)據(jù)分析,拉出當(dāng)天3~6點申請貸款的客戶的全部信息:性別、年齡、籍貫、手機號、婚姻狀態(tài),駕照信息、申請地點等等……
經(jīng)過幾個小時的分析,最終得出結(jié)論:這是一起無組織的集體擼貸行為。
原因也很簡單:這些客戶分散在全國各地,申請時間高度集中,而且申請的貸款流程中約50%的人上傳的都是同一個駕照信息。
作為一名優(yōu)秀的數(shù)據(jù)分析師,并不會甘于只做探索性分析,而是會給出指導(dǎo)和改進的建議。
比如說我上面講的的故事里,我們部門在發(fā)現(xiàn)了這個問題后,給業(yè)務(wù)部門提出了優(yōu)化建議:建議在貸款流程中加入駕照身份核驗,必須要身份信息和駕照信息一致才能申請貸款。
因為有數(shù)據(jù)支撐,業(yè)務(wù)部門也很快采納了我們的建議。
第三類:指導(dǎo)性數(shù)據(jù)分析

指導(dǎo)性分析,英文名叫Confirmatory Data Analysis,簡稱CDA。
別被它的名字給誤導(dǎo)了,基本大多數(shù)研究生和博士生論文都是指導(dǎo)性分析,也就是所謂的實證分析。
它要求你在做數(shù)據(jù)分析前,先明確研究問題,并提出假設(shè),然后通過嚴格的統(tǒng)計方法和模型驗證,對數(shù)據(jù)進行檢驗和分析,以驗證研究假設(shè)的有效性和可靠性。
和探索性分析不同,指導(dǎo)性分析的目標是驗證數(shù)據(jù)分析中的假設(shè)和研究結(jié)論是否正確,它需要做出明確的假設(shè),并通過統(tǒng)計模型和驗證方法來檢驗假設(shè)的有效性,以確保分析結(jié)果的可靠性。
CDA通常是在EDA之后進行,當(dāng)我們已經(jīng)了解數(shù)據(jù)并發(fā)現(xiàn)有趣的關(guān)系時,需要進行進一步的驗證和檢驗。
CDA在科學(xué)研究和數(shù)據(jù)分析中非常重要,因為它可以幫助我們確定研究結(jié)論的有效性,并排除偶然性和誤差的影響。
同時,CDA也可以幫助我們發(fā)現(xiàn)數(shù)據(jù)中的異常和離群值,以及其他可能影響分析結(jié)論的因素。
第四類:預(yù)測性數(shù)據(jù)分析

預(yù)測性分析,又叫Predictive Analytics。這個概念有點晦澀,但卻早已飛入尋常百姓家。
預(yù)測分析是指通過對歷史數(shù)據(jù)和趨勢的分析和建模,預(yù)測未來事件或行為的發(fā)生概率或趨勢。
它的目標是利用現(xiàn)有的數(shù)據(jù)建立預(yù)測模型,它可以幫助決策者更好地理解未來發(fā)展趨勢和可能發(fā)生的事件,以便制定更加科學(xué)的決策和策略或者讓用戶更加上癮。
看到這個,你是不是想起了抖音、快手、微信視頻號。沒錯,這類短視頻工具無一例外地使用了預(yù)測性數(shù)據(jù)分析,它可以將你的注意力數(shù)據(jù)作為輸入,輸出你更為感興趣的視頻 ,讓你越刷越想刷,越刷越停不下來。



抖音2小時,人間五分鐘。就是這么來的。
預(yù)測性分析有較高的技術(shù)門檻,它需要完整的數(shù)據(jù)清洗、特征選擇、模型選擇和評估等步驟。
在建立預(yù)測模型時,我們需要選擇合適的特征和算法,并對模型進行訓(xùn)練和優(yōu)化,以達到最佳的預(yù)測效果。
這些從業(yè)人員也一般稱之為算法工程師,而不再是數(shù)據(jù)分析師了。

-----------------------------
精選高品質(zhì)二手iPhone,上愛鋒貝APP
您需要登錄后才可以回帖 登錄 | 立即注冊   

本版積分規(guī)則

QQ|Archiver|手機版|小黑屋|愛鋒貝 ( 粵ICP備16041312號-5 )

GMT+8, 2025-2-8 23:26

Powered by Discuz! X3.4

© 2001-2013 Discuz Team. 技術(shù)支持 by 巔峰設(shè)計.

快速回復(fù) 返回頂部 返回列表