愛(ài)鋒貝

 找回密碼
 立即注冊(cè)

只需一步,快速開(kāi)始

扫一扫,极速登录

查看: 732|回復(fù): 0
打印 上一主題 下一主題
收起左側(cè)

數(shù)據(jù)分析第2篇|深入理解:探究四種常見(jiàn)的數(shù)據(jù)分析類型

[復(fù)制鏈接]

1466

主題

1535

帖子

6017

積分

Rank: 8Rank: 8

跳轉(zhuǎn)到指定樓層
樓主
發(fā)表于 2023-4-3 06:33:15 | 只看該作者 回帖獎(jiǎng)勵(lì) |倒序?yàn)g覽 |閱讀模式

一鍵注冊(cè),加入手機(jī)圈

您需要 登錄 才可以下載或查看,沒(méi)有帳號(hào)?立即注冊(cè)   

x


在【數(shù)據(jù)分析第一篇|概念掃盲】,通過(guò)三個(gè)故事簡(jiǎn)單給大家掃盲了一下數(shù)據(jù)分析的概念,讓你可以快速理解數(shù)據(jù)分析的本質(zhì)。但真實(shí)的數(shù)據(jù)分析肯定是要復(fù)雜的多。
?我們提到數(shù)據(jù)分析就是從數(shù)據(jù)中提取有價(jià)值的信息的過(guò)程,目的是用于決策。數(shù)據(jù)分析是一個(gè)過(guò)程,是一個(gè)我們通過(guò)數(shù)據(jù)理解世界的一個(gè)過(guò)程。
在劉慈欣的科幻小說(shuō)《三體》中,智子是一種超級(jí)人工智能,其能力和智慧遠(yuǎn)超人類。故事中三體人通過(guò)智子 鎖死了人類科技。
其鎖死人類科技的核心就是在微觀層面干擾人類科學(xué)實(shí)結(jié)果,從而使人類科學(xué)家不能正確地開(kāi)展數(shù)據(jù)分析,無(wú)法對(duì)物質(zhì)深層的結(jié)構(gòu)進(jìn)行有效探索,失去了理解世界的能力,從而無(wú)法產(chǎn)生突破性的科學(xué)發(fā)展。
由此可見(jiàn)數(shù)據(jù)分析的重要性。這篇文章,我們就來(lái)聊一聊數(shù)據(jù)分析的四種類型,了解一下如何利用數(shù)據(jù)來(lái)幫助我們更好地理解世界。
第一類:描述型數(shù)據(jù)分析

我們都知道,所謂的數(shù)據(jù)是對(duì)事實(shí)的描述,比如說(shuō)你的身高、體重、籍貫等等。對(duì)這些數(shù)據(jù)的描述本身也是一種分析。
舉一個(gè)例子:最近我在看房子,每天會(huì)關(guān)注成都市二手房的成交量,比如說(shuō){2023年2月27日成都二手房成交了465套}
這就是描述型分析,如果你寫過(guò)實(shí)證分析相關(guān)的論文,這個(gè)就是對(duì)數(shù)據(jù)的描述,比如說(shuō)我上面提到的畢業(yè)論文,在完成數(shù)據(jù)處理后會(huì)做一個(gè)描述型統(tǒng)計(jì)分析:
2012年,國(guó)有企業(yè)控制下的上市公司數(shù)量達(dá)到了1176家,占比超過(guò)50%,到2016年,這個(gè)數(shù)字下降到了1015家,占比降至不到50%。與此同時(shí),民營(yíng)企業(yè)控制下的上市公司數(shù)量在同期內(nèi)從978家增加到了1183家……
第二類:探索性數(shù)據(jù)分析

探索性數(shù)據(jù)分析,有個(gè)英文名叫Exploratory Data Analysis,簡(jiǎn)稱EDA。我們所說(shuō)的一般意義上的數(shù)據(jù)分析就是指探索性分析。
所謂的探索性分析就是提出一個(gè)問(wèn)題,然后通過(guò)數(shù)據(jù)的特征、規(guī)律、分布和異常等情況,給出問(wèn)題的答案,輔助決策。
這也是一般企業(yè)里數(shù)據(jù)分析師的核心工作:比如說(shuō)探究什么用戶注冊(cè)數(shù)變少了?為什么公司的GMV下滑了?等用戶運(yùn)營(yíng)或者產(chǎn)品運(yùn)營(yíng)層面的問(wèn)題。
講一個(gè)故事:
2021年我在一家公司金融小貸部門做數(shù)據(jù)產(chǎn)品經(jīng)理,主要做貸前的反欺詐產(chǎn)品。
有一天運(yùn)營(yíng)部門的同事突然發(fā)現(xiàn),當(dāng)天下午的3點(diǎn)-6點(diǎn),申請(qǐng)貸款的用戶暴增,而且比過(guò)往的每天平均客戶數(shù)多了2倍多,而且還在持續(xù)增長(zhǎng),于是立刻匯報(bào)給了部門領(lǐng)導(dǎo).
部門領(lǐng)導(dǎo)就給數(shù)據(jù)分析的同事拋出來(lái)一個(gè)問(wèn)題:是什么原因?qū)е掠脩魯?shù)驟增?
數(shù)據(jù)分析的同學(xué)接到任務(wù),立刻著手進(jìn)行數(shù)據(jù)分析,拉出當(dāng)天3~6點(diǎn)申請(qǐng)貸款的客戶的全部信息:性別、年齡、籍貫、手機(jī)號(hào)、婚姻狀態(tài),駕照信息、申請(qǐng)地點(diǎn)等等……
經(jīng)過(guò)幾個(gè)小時(shí)的分析,最終得出結(jié)論:這是一起無(wú)組織的集體擼貸行為。
原因也很簡(jiǎn)單:這些客戶分散在全國(guó)各地,申請(qǐng)時(shí)間高度集中,而且申請(qǐng)的貸款流程中約50%的人上傳的都是同一個(gè)駕照信息。
作為一名優(yōu)秀的數(shù)據(jù)分析師,并不會(huì)甘于只做探索性分析,而是會(huì)給出指導(dǎo)和改進(jìn)的建議。
比如說(shuō)我上面講的的故事里,我們部門在發(fā)現(xiàn)了這個(gè)問(wèn)題后,給業(yè)務(wù)部門提出了優(yōu)化建議:建議在貸款流程中加入駕照身份核驗(yàn),必須要身份信息和駕照信息一致才能申請(qǐng)貸款。
因?yàn)橛袛?shù)據(jù)支撐,業(yè)務(wù)部門也很快采納了我們的建議。
第三類:指導(dǎo)性數(shù)據(jù)分析

指導(dǎo)性分析,英文名叫Confirmatory Data Analysis,簡(jiǎn)稱CDA。
別被它的名字給誤導(dǎo)了,基本大多數(shù)研究生和博士生論文都是指導(dǎo)性分析,也就是所謂的實(shí)證分析。
它要求你在做數(shù)據(jù)分析前,先明確研究問(wèn)題,并提出假設(shè),然后通過(guò)嚴(yán)格的統(tǒng)計(jì)方法和模型驗(yàn)證,對(duì)數(shù)據(jù)進(jìn)行檢驗(yàn)和分析,以驗(yàn)證研究假設(shè)的有效性和可靠性。
和探索性分析不同,指導(dǎo)性分析的目標(biāo)是驗(yàn)證數(shù)據(jù)分析中的假設(shè)和研究結(jié)論是否正確,它需要做出明確的假設(shè),并通過(guò)統(tǒng)計(jì)模型和驗(yàn)證方法來(lái)檢驗(yàn)假設(shè)的有效性,以確保分析結(jié)果的可靠性。
CDA通常是在EDA之后進(jìn)行,當(dāng)我們已經(jīng)了解數(shù)據(jù)并發(fā)現(xiàn)有趣的關(guān)系時(shí),需要進(jìn)行進(jìn)一步的驗(yàn)證和檢驗(yàn)。
CDA在科學(xué)研究和數(shù)據(jù)分析中非常重要,因?yàn)樗梢詭椭覀兇_定研究結(jié)論的有效性,并排除偶然性和誤差的影響。
同時(shí),CDA也可以幫助我們發(fā)現(xiàn)數(shù)據(jù)中的異常和離群值,以及其他可能影響分析結(jié)論的因素。
第四類:預(yù)測(cè)性數(shù)據(jù)分析

預(yù)測(cè)性分析,又叫Predictive Analytics。這個(gè)概念有點(diǎn)晦澀,但卻早已飛入尋常百姓家。
預(yù)測(cè)分析是指通過(guò)對(duì)歷史數(shù)據(jù)和趨勢(shì)的分析和建模,預(yù)測(cè)未來(lái)事件或行為的發(fā)生概率或趨勢(shì)。
它的目標(biāo)是利用現(xiàn)有的數(shù)據(jù)建立預(yù)測(cè)模型,它可以幫助決策者更好地理解未來(lái)發(fā)展趨勢(shì)和可能發(fā)生的事件,以便制定更加科學(xué)的決策和策略或者讓用戶更加上癮。
看到這個(gè),你是不是想起了抖音、快手、微信視頻號(hào)。沒(méi)錯(cuò),這類短視頻工具無(wú)一例外地使用了預(yù)測(cè)性數(shù)據(jù)分析,它可以將你的注意力數(shù)據(jù)作為輸入,輸出你更為感興趣的視頻 ,讓你越刷越想刷,越刷越停不下來(lái)。



抖音2小時(shí),人間五分鐘。就是這么來(lái)的。
預(yù)測(cè)性分析有較高的技術(shù)門檻,它需要完整的數(shù)據(jù)清洗、特征選擇、模型選擇和評(píng)估等步驟。
在建立預(yù)測(cè)模型時(shí),我們需要選擇合適的特征和算法,并對(duì)模型進(jìn)行訓(xùn)練和優(yōu)化,以達(dá)到最佳的預(yù)測(cè)效果。
這些從業(yè)人員也一般稱之為算法工程師,而不再是數(shù)據(jù)分析師了。

-----------------------------
精選高品質(zhì)二手iPhone,上愛(ài)鋒貝APP
您需要登錄后才可以回帖 登錄 | 立即注冊(cè)   

本版積分規(guī)則

QQ|Archiver|手機(jī)版|小黑屋|愛(ài)鋒貝 ( 粵ICP備16041312號(hào)-5 )

GMT+8, 2025-2-9 01:49

Powered by Discuz! X3.4

© 2001-2013 Discuz Team. 技術(shù)支持 by 巔峰設(shè)計(jì).

快速回復(fù) 返回頂部 返回列表