|
一鍵注冊(cè),加入手機(jī)圈
您需要 登錄 才可以下載或查看,沒(méi)有帳號(hào)?立即注冊(cè) ![](source/plugin/mapp_wechat/images/wechat_login.png)
x
本文是基于Excel進(jìn)行數(shù)據(jù)清洗和利用tableau進(jìn)行深圳二手房市場(chǎng)可視化數(shù)據(jù)分析。
分析思路:
1.提出問(wèn)題
2.數(shù)據(jù)理解
3.數(shù)據(jù)處理與清洗
4.各區(qū)市場(chǎng)整體概覽
5.二手房維度分析
6.總結(jié)
一、提出問(wèn)題
1.希望了解目前深圳各區(qū)二手房的數(shù)量、總價(jià)和單價(jià)情況,以及探索與各區(qū)GDP有無(wú)關(guān)聯(lián);
2.希望了解深圳二手房總體價(jià)格趨勢(shì);
3.希望了解深圳二手房的特點(diǎn),及探索一些關(guān)鍵指標(biāo)與價(jià)格的關(guān)系。
深圳二手房市場(chǎng)數(shù)據(jù)分析-1.jpg (58.39 KB, 下載次數(shù): 137)
下載附件
2023-3-29 14:32 上傳
二、數(shù)據(jù)理解
1.數(shù)據(jù)獲取
2020年3月5日,爬蟲(chóng)獲取的鏈家深圳二手房房源信息,總共包括18906條記錄,11個(gè)字段。
2.字段注解
area :行政區(qū)
Title:房源信息標(biāo)題
Community:小區(qū)
Position:地段位置
Tax:稅率相關(guān)
total_price:總價(jià)
unit_price:?jiǎn)蝺r(jià)
hourseType:戶型
hourseSize:面積
Direction:房間朝向
Fitment:裝修
三、數(shù)據(jù)處理與清洗(Excel)
數(shù)據(jù)處理與清洗前先復(fù)制一份數(shù)據(jù),保留數(shù)據(jù)的完整性,備用。
1.刪除重復(fù)值
對(duì)數(shù)據(jù)集序號(hào)這個(gè)唯一標(biāo)識(shí)進(jìn)行去重,結(jié)果顯示沒(méi)有重復(fù)值
深圳二手房市場(chǎng)數(shù)據(jù)分析-2.jpg (117.51 KB, 下載次數(shù): 113)
下載附件
2023-3-29 14:32 上傳
2.處理缺失值
對(duì)數(shù)據(jù)集序號(hào)這個(gè)唯一標(biāo)識(shí)進(jìn)行空值查詢,結(jié)果顯示沒(méi)有空值
深圳二手房市場(chǎng)數(shù)據(jù)分析-3.jpg (171.89 KB, 下載次數(shù): 121)
下載附件
2023-3-29 14:32 上傳
3.一致化處理
3.1 增加“year”列:對(duì)原有“tax”列做處理
IF(F2="房本滿五年","滿五年房","未滿五年房")
深圳二手房市場(chǎng)數(shù)據(jù)分析-4.jpg (170.85 KB, 下載次數(shù): 124)
下載附件
2023-3-29 14:32 上傳
3.2 分列處理房間朝向
深圳二手房市場(chǎng)數(shù)據(jù)分析-5.jpg (162.67 KB, 下載次數(shù): 135)
下載附件
2023-3-29 14:32 上傳
3.3 常規(guī)類(lèi)型改成數(shù)值類(lèi)型,方便后續(xù)計(jì)算分析;刪除無(wú)關(guān)分析的列
按照以上步驟,處理和清洗好的數(shù)據(jù)如下:
深圳二手房市場(chǎng)數(shù)據(jù)分析-6.jpg (166.88 KB, 下載次數(shù): 144)
下載附件
2023-3-29 14:32 上傳
將數(shù)據(jù)導(dǎo)入tableau進(jìn)行可視化分析。
四、各區(qū)市場(chǎng)整體概覽
1.各區(qū)房源數(shù)量分布
深圳二手房市場(chǎng)數(shù)據(jù)分析-7.jpg (43.05 KB, 下載次數(shù): 121)
下載附件
2023-3-29 14:32 上傳
總體來(lái)看,深圳二手房市場(chǎng)可謂相當(dāng)活躍,可能是因?yàn)殒溂揖W(wǎng)站數(shù)據(jù)限制的原因,福田區(qū)、龍崗區(qū)、羅湖區(qū)、南山區(qū)同時(shí)擁有最多的房源,龍崗作為唯一的關(guān)外地區(qū),二手房市場(chǎng)也是相當(dāng)?shù)幕钴S;其次是龍華區(qū),與寶安區(qū)數(shù)量基本持平;接著是鹽田區(qū)和坪山區(qū),坪山區(qū)作為正式成立不久的地區(qū),正在進(jìn)行大拆大建的進(jìn)程中,二手房數(shù)量最少也能理解。
1.1這里還可以深入探討一下二手房數(shù)量是否與GDP高低相關(guān)?
在網(wǎng)上找到剛剛發(fā)布不久的深圳2019全年GDP排名:
深圳二手房市場(chǎng)數(shù)據(jù)分析-8.jpg (41.6 KB, 下載次數(shù): 149)
下載附件
2023-3-29 14:32 上傳
GDP排名:南山、龍崗、福田、寶安、龍華、羅湖、光明、坪山、鹽田
房源排名:南山、龍崗、福田、羅湖、龍華、寶安、鹽田、坪山、光明(鏈家無(wú)房源)
將數(shù)據(jù)制成表導(dǎo)入tableau,與原表按照字段“area”鏈接后進(jìn)行下一步處理。
先觀察散點(diǎn)圖:
深圳二手房市場(chǎng)數(shù)據(jù)分析-9.jpg (35.48 KB, 下載次數(shù): 142)
下載附件
2023-3-29 14:32 上傳
有點(diǎn)像對(duì)數(shù)函數(shù),可以先嘗試一下對(duì)數(shù)函數(shù)
深圳二手房市場(chǎng)數(shù)據(jù)分析-10.jpg (46.51 KB, 下載次數(shù): 138)
下載附件
2023-3-29 14:32 上傳
二手房數(shù)量 = 1054.07*ln(GDP) + -5890.8
R平方=0.804266(模型好像還不錯(cuò))
R平方(決定系數(shù)):也稱為判定系數(shù)、擬合優(yōu)度。決定系數(shù)反應(yīng)了y的波動(dòng)有多少百分比能被x的波動(dòng)所描述,即表征依變數(shù)Y的變異中有多少百分比,可由控制的自變數(shù)X來(lái)解釋。
R平方為回歸平方和與總離差平方和的比值,這一比例越大越好,模型越精確,回歸效果越顯著。R平方介于0~1之間,越接近1,回歸擬合效果越好,一般認(rèn)為超過(guò)0.8的模型擬合優(yōu)度比較高。
結(jié)論:
該處二手房數(shù)量與GDP的R平方計(jì)算出來(lái)為0.804266,回歸擬合效果較好,自變量對(duì)因變量的解釋程度較高,可靠性高。(數(shù)據(jù)量不夠多,存在偏差情況,圖形僅供參考)
2.各區(qū)二手房市場(chǎng)均價(jià)
深圳二手房市場(chǎng)數(shù)據(jù)分析-11.jpg (48.66 KB, 下載次數(shù): 118)
下載附件
2023-3-29 14:32 上傳
南山區(qū)的二手房平均房?jī)r(jià)高達(dá)92000+元/平方,最少的坪山區(qū)也達(dá)到了35000+元/平方,看完這個(gè)數(shù)據(jù),弱弱的小編我默不作聲了。。。
3.各區(qū)二手房總價(jià)分布箱線圖
深圳二手房市場(chǎng)數(shù)據(jù)分析-12.jpg (88.62 KB, 下載次數(shù): 145)
下載附件
2023-3-29 14:32 上傳
從箱線圖可以看出,深圳各區(qū)超過(guò)最大值的異常值都不少,說(shuō)明深圳的房?jī)r(jià)極端分布,高端建筑很多。各區(qū)的中位數(shù)都超過(guò)了300W,其中南山、福田、龍華、寶安的中位數(shù)已經(jīng)超過(guò)500W??磥?lái)想在深圳買(mǎi)個(gè)二手房,還有漫長(zhǎng)的路要走。一手房那就更不敢想了。
4. 各區(qū)二手房單價(jià)分布箱線圖
深圳二手房市場(chǎng)數(shù)據(jù)分析-13.jpg (90.12 KB, 下載次數(shù): 140)
下載附件
2023-3-29 14:32 上傳
同樣,各區(qū)二手房單價(jià)的異常值也很多,各區(qū)的中位數(shù)都超過(guò)了35000元/平方,各位且行且珍惜吧。
五、二手房市場(chǎng)分析
1.二手房?jī)r(jià)格整體概覽
1.1 總價(jià)格分布
深圳二手房市場(chǎng)數(shù)據(jù)分析-14.jpg (70.09 KB, 下載次數(shù): 116)
下載附件
2023-3-29 14:32 上傳
1000W以下的房子幾乎占了90%
最左邊豎線為下四分位線:328W;
中間豎線為中位數(shù):633W;
最右邊為上四分位線:1298W;
平均值:687W;
最小值:24W;
最大值:8800W(招商華僑城曦城五期,600平方,單價(jià)14K,太壕了)。
1.2 單價(jià)分布
深圳二手房市場(chǎng)數(shù)據(jù)分析-15.jpg (46.11 KB, 下載次數(shù): 127)
下載附件
2023-3-29 14:32 上傳
房源單價(jià)集中在30K-90K元/平方之間
最左邊豎線為下四分位線:46442元/平方;
中間豎線為中位數(shù):60548元/平方;
最右邊為上四分位線:79898元/平方;
平均值:64893元/平方;
最小值:506元/平方;
最大值:225635元/平方(金茂禮都,31平方,總價(jià)720W,真是寸土寸金啊)。
2.二手房特點(diǎn)分析
2.1 戶型分析
深圳二手房市場(chǎng)數(shù)據(jù)分析-16.jpg (25.87 KB, 下載次數(shù): 136)
下載附件
2023-3-29 14:32 上傳
3室2廳的戶型是最多的,符合中國(guó)人偏好3室的特點(diǎn);其次是“2室1廳”,在老房子中也是很普遍。
3房2廳平均面積有102.80平方,單價(jià)中位數(shù)56494元/平方,總價(jià)中位數(shù)545萬(wàn)。
2.2 面積分布
深圳二手房市場(chǎng)數(shù)據(jù)分析-17.jpg (35.08 KB, 下載次數(shù): 158)
下載附件
2023-3-29 14:32 上傳
50-100平方的房源占了一半的數(shù)量,房源的面積基本在150平方以下。
最大的房源面積來(lái)自寶安區(qū)的弘雅花園第二期,共計(jì)10871平方(真的嗎?真是壕無(wú)人性,小編瑟瑟發(fā)抖ing)此處原數(shù)據(jù)集大概率有誤,因?yàn)閱蝺r(jià)才506元/平方;
最小的房源面積13.15平方;中位數(shù)88.26平方;平均值100.62平方。
2.3 朝向分布
深圳二手房市場(chǎng)數(shù)據(jù)分析-18.jpg (38.43 KB, 下載次數(shù): 124)
下載附件
2023-3-29 14:32 上傳
朝南、東南、北的房源是最多的,中國(guó)人自古講究房屋坐北向南,無(wú)論風(fēng)水還是居住舒適程度,這都會(huì)促使居民選擇這一類(lèi)房子,也同樣促使開(kāi)發(fā)商盡量開(kāi)發(fā)朝南、朝北的房子。
2.4 地段分布
深圳二手房市場(chǎng)數(shù)據(jù)分析-19.jpg (94 KB, 下載次數(shù): 122)
下載附件
2023-3-29 14:32 上傳
龍崗區(qū)的龍崗中心城是房源數(shù)量最多的地段,其次還有寶安區(qū)的西鄉(xiāng)、龍華區(qū)的龍華中心和觀瀾、鹽田區(qū)的沙頭角;
深圳二手房市場(chǎng)數(shù)據(jù)分析-20.jpg (54.68 KB, 下載次數(shù): 129)
下載附件
2023-3-29 14:32 上傳
總價(jià)(中位數(shù))最高的地段是寶安區(qū)的曦城,其次還有南山區(qū)的紅樹(shù)灣和深圳灣、福田區(qū)的香蜜湖和百花;
深圳二手房市場(chǎng)數(shù)據(jù)分析-21.jpg (95.91 KB, 下載次數(shù): 136)
下載附件
2023-3-29 14:32 上傳
單價(jià)(中位數(shù))最高的地段是南山區(qū)的深圳灣,其次還有福田區(qū)的百花和香蜜湖,南山區(qū)的紅樹(shù)灣,寶安區(qū)的寶安中心。
綜合來(lái)講,房源數(shù)量最多的地段是龍崗區(qū)、寶安區(qū)和龍華區(qū),房源較多的地段,價(jià)格相對(duì)而言會(huì)便宜一些;而無(wú)論是總價(jià)和單價(jià),最多的地區(qū)都是南山區(qū)、福田區(qū)和寶安區(qū),這和近年來(lái)深圳南山、福田、寶安大力發(fā)展高新科技企業(yè)、吸納高層次人才是密切相關(guān)的。
那為什么龍崗中心城的房源數(shù)量最多呢?
首先,龍崗中心城是龍崗區(qū)的CBD地段,而龍崗區(qū)的房源是全市最多的地區(qū)之一,因此龍崗中心城的房源數(shù)量可觀;
其次,近年來(lái)龍崗區(qū)雖然是關(guān)外地區(qū),但發(fā)展勢(shì)頭迅猛,GDP接連超過(guò)寶安、福田,直逼南山,在經(jīng)濟(jì)、人才、建設(shè)、娛樂(lè)等多方面絲毫不落下風(fēng),常駐人口逐年上升,預(yù)計(jì)還會(huì)有更多的房源;
再者,龍崗作為深圳市地域面積最大的一個(gè)區(qū)域,擁有大量的土地資源,再加上有地鐵和密集公路網(wǎng)的優(yōu)越交通條件,所以龍崗中心城將會(huì)更加完善更加宜居。
總之,龍崗潛力無(wú)限。
2.5 裝修分布
深圳二手房市場(chǎng)數(shù)據(jù)分析-22.jpg (110.71 KB, 下載次數(shù): 134)
下載附件
2023-3-29 14:32 上傳
上圖是各區(qū)不同裝修類(lèi)型房源數(shù)量;下圖是不同裝修類(lèi)型房源與單價(jià)和總價(jià)的關(guān)系
在深圳二手房市場(chǎng)中,各區(qū)的精裝房占了絕大多數(shù),毛坯房的數(shù)量極少,且兩者的價(jià)格都比較高;而簡(jiǎn)裝房的單價(jià)和總價(jià)更低一些。
2.6 房齡分布
深圳二手房市場(chǎng)數(shù)據(jù)分析-23.jpg (34.22 KB, 下載次數(shù): 105)
下載附件
2023-3-29 14:32 上傳
圖中的數(shù)字代表各區(qū)該房齡單價(jià)的中位數(shù)
a.超過(guò)五年的房源占比高;
b.像坪山剛成立不久的地區(qū),房子大多比較新;
c.從數(shù)據(jù)可以看出,老房子和新房子的單價(jià)并沒(méi)有太大差異,也就是說(shuō),房齡并不是造成房子單價(jià)差異的原因,這可能是和深圳地少人多,房地產(chǎn)市場(chǎng)一直處于飽滿的狀態(tài)有關(guān)。
六、總結(jié)
1.從區(qū)域來(lái)看,福田區(qū)、龍崗區(qū)、羅湖區(qū)、南山區(qū)的二手房房源最多,房源數(shù)量與各區(qū)GDP呈現(xiàn)出某種對(duì)數(shù)關(guān)系;南山區(qū)、福田區(qū)、寶安區(qū)的均價(jià)位列前三甲,其主要原因是這些地方房?jī)r(jià)普遍價(jià)高再加上大量的異常值,進(jìn)一步拉高了價(jià)格;此外,各區(qū)房源總價(jià)中位數(shù)均超過(guò)了300W,單價(jià)中位數(shù)均超過(guò)了35000元/平方;
2.從具體的地段上看,龍崗區(qū)的龍崗中心城是房源數(shù)量最多的地段,其次還有寶安區(qū)的西鄉(xiāng)、龍華區(qū)的龍華中心和觀瀾,這些地段的房源多價(jià)格也相對(duì)較低,其中龍崗區(qū)的龍崗中心城共有763套房源,總價(jià)中位數(shù)390W,單價(jià)中位數(shù)38015元/平方。
3.從二手房市場(chǎng)整體來(lái)看,絕大部分房源總價(jià)在1500W以下,中位數(shù)633W,平均值687W,范圍從24W到8800W;房源單價(jià)集中在30K-90K元/平方,中位數(shù)60548元/平方,平均值64893元/平方,范圍從506元/平方到225635元/平方。
4.從二手房特點(diǎn)來(lái)看,3室2廳戶型的房源數(shù)量最多,其次是2室1廳;朝南房數(shù)量最多,其次是朝東南和朝北房;超過(guò)一半房源面積在50平方-100平方之間;精裝房占了絕大多數(shù),毛坯房的數(shù)量極少且這兩者的價(jià)格都比較高,而簡(jiǎn)裝房的單價(jià)和總價(jià)更低一些;除坪山外,老房子(超過(guò)五年)的數(shù)量都要比新房子(少于5年)多,老房子和新房子的單價(jià)并無(wú)太大區(qū)別。
----------------------------- |
|