愛鋒貝

標(biāo)題: 深圳二手房市場數(shù)據(jù)分析 [打印本頁]

作者: ¤科技獸¤    時間: 2023-3-28 12:38
標(biāo)題: 深圳二手房市場數(shù)據(jù)分析
本文是基于Excel進行數(shù)據(jù)清洗和利用tableau進行深圳二手房市場可視化數(shù)據(jù)分析。
分析思路:
1.提出問題
2.數(shù)據(jù)理解
3.數(shù)據(jù)處理與清洗
4.各區(qū)市場整體概覽
5.二手房維度分析
6.總結(jié)

一、提出問題

1.希望了解目前深圳各區(qū)二手房的數(shù)量、總價和單價情況,以及探索與各區(qū)GDP有無關(guān)聯(lián);
2.希望了解深圳二手房總體價格趨勢;
3.希望了解深圳二手房的特點,及探索一些關(guān)鍵指標(biāo)與價格的關(guān)系。

(, 下載次數(shù): 137)
二、數(shù)據(jù)理解

1.數(shù)據(jù)獲取
2020年3月5日,爬蟲獲取的鏈家深圳二手房房源信息,總共包括18906條記錄,11個字段。
2.字段注解
area :行政區(qū)
Title:房源信息標(biāo)題
Community:小區(qū)
Position:地段位置
Tax:稅率相關(guān)
total_price:總價
unit_price:單價
hourseType:戶型
hourseSize:面積
Direction:房間朝向
Fitment:裝修
三、數(shù)據(jù)處理與清洗(Excel)

數(shù)據(jù)處理與清洗前先復(fù)制一份數(shù)據(jù),保留數(shù)據(jù)的完整性,備用。
1.刪除重復(fù)值
對數(shù)據(jù)集序號這個唯一標(biāo)識進行去重,結(jié)果顯示沒有重復(fù)值

(, 下載次數(shù): 113)
2.處理缺失值
對數(shù)據(jù)集序號這個唯一標(biāo)識進行空值查詢,結(jié)果顯示沒有空值

(, 下載次數(shù): 120)
3.一致化處理
3.1 增加“year”列:對原有“tax”列做處理
IF(F2="房本滿五年","滿五年房","未滿五年房")

(, 下載次數(shù): 124)
3.2 分列處理房間朝向

(, 下載次數(shù): 135)
3.3 常規(guī)類型改成數(shù)值類型,方便后續(xù)計算分析;刪除無關(guān)分析的列
按照以上步驟,處理和清洗好的數(shù)據(jù)如下:

(, 下載次數(shù): 144)
將數(shù)據(jù)導(dǎo)入tableau進行可視化分析。
四、各區(qū)市場整體概覽

1.各區(qū)房源數(shù)量分布

(, 下載次數(shù): 121)
總體來看,深圳二手房市場可謂相當(dāng)活躍,可能是因為鏈家網(wǎng)站數(shù)據(jù)限制的原因,福田區(qū)、龍崗區(qū)、羅湖區(qū)、南山區(qū)同時擁有最多的房源,龍崗作為唯一的關(guān)外地區(qū),二手房市場也是相當(dāng)?shù)幕钴S;其次是龍華區(qū),與寶安區(qū)數(shù)量基本持平;接著是鹽田區(qū)和坪山區(qū),坪山區(qū)作為正式成立不久的地區(qū),正在進行大拆大建的進程中,二手房數(shù)量最少也能理解。
1.1這里還可以深入探討一下二手房數(shù)量是否與GDP高低相關(guān)?
在網(wǎng)上找到剛剛發(fā)布不久的深圳2019全年GDP排名:

(, 下載次數(shù): 149)
GDP排名:南山、龍崗、福田、寶安、龍華、羅湖、光明、坪山、鹽田
房源排名:南山、龍崗、福田、羅湖、龍華、寶安、鹽田、坪山、光明(鏈家無房源)
將數(shù)據(jù)制成表導(dǎo)入tableau,與原表按照字段“area”鏈接后進行下一步處理。
先觀察散點圖:

(, 下載次數(shù): 142)
有點像對數(shù)函數(shù),可以先嘗試一下對數(shù)函數(shù)

(, 下載次數(shù): 137)
二手房數(shù)量 = 1054.07*ln(GDP) + -5890.8
R平方=0.804266(模型好像還不錯)
R平方(決定系數(shù)):也稱為判定系數(shù)、擬合優(yōu)度。決定系數(shù)反應(yīng)了y的波動有多少百分比能被x的波動所描述,即表征依變數(shù)Y的變異中有多少百分比,可由控制的自變數(shù)X來解釋。
R平方為回歸平方和與總離差平方和的比值,這一比例越大越好,模型越精確,回歸效果越顯著。R平方介于0~1之間,越接近1,回歸擬合效果越好,一般認(rèn)為超過0.8的模型擬合優(yōu)度比較高。
結(jié)論:
該處二手房數(shù)量與GDP的R平方計算出來為0.804266,回歸擬合效果較好,自變量對因變量的解釋程度較高,可靠性高。(數(shù)據(jù)量不夠多,存在偏差情況,圖形僅供參考)
2.各區(qū)二手房市場均價

(, 下載次數(shù): 118)
南山區(qū)的二手房平均房價高達(dá)92000+元/平方,最少的坪山區(qū)也達(dá)到了35000+元/平方,看完這個數(shù)據(jù),弱弱的小編我默不作聲了。。。
3.各區(qū)二手房總價分布箱線圖

(, 下載次數(shù): 145)
從箱線圖可以看出,深圳各區(qū)超過最大值的異常值都不少,說明深圳的房價極端分布,高端建筑很多。各區(qū)的中位數(shù)都超過了300W,其中南山、福田、龍華、寶安的中位數(shù)已經(jīng)超過500W??磥硐朐谏钲谫I個二手房,還有漫長的路要走。一手房那就更不敢想了。
4. 各區(qū)二手房單價分布箱線圖

(, 下載次數(shù): 140)
同樣,各區(qū)二手房單價的異常值也很多,各區(qū)的中位數(shù)都超過了35000元/平方,各位且行且珍惜吧。
五、二手房市場分析

1.二手房價格整體概覽
1.1 總價格分布

(, 下載次數(shù): 116)
1000W以下的房子幾乎占了90%
最左邊豎線為下四分位線:328W;
中間豎線為中位數(shù):633W;
最右邊為上四分位線:1298W;
平均值:687W;
最小值:24W;
最大值:8800W(招商華僑城曦城五期,600平方,單價14K,太壕了)。
1.2 單價分布

(, 下載次數(shù): 127)
房源單價集中在30K-90K元/平方之間
最左邊豎線為下四分位線:46442元/平方;
中間豎線為中位數(shù):60548元/平方;
最右邊為上四分位線:79898元/平方;
平均值:64893元/平方;
最小值:506元/平方;
最大值:225635元/平方(金茂禮都,31平方,總價720W,真是寸土寸金?。?。
2.二手房特點分析
2.1 戶型分析

(, 下載次數(shù): 136)
3室2廳的戶型是最多的,符合中國人偏好3室的特點;其次是“2室1廳”,在老房子中也是很普遍。
3房2廳平均面積有102.80平方,單價中位數(shù)56494元/平方,總價中位數(shù)545萬。
2.2 面積分布

(, 下載次數(shù): 157)
50-100平方的房源占了一半的數(shù)量,房源的面積基本在150平方以下。
最大的房源面積來自寶安區(qū)的弘雅花園第二期,共計10871平方(真的嗎?真是壕無人性,小編瑟瑟發(fā)抖ing)此處原數(shù)據(jù)集大概率有誤,因為單價才506元/平方;
最小的房源面積13.15平方;中位數(shù)88.26平方;平均值100.62平方。
2.3 朝向分布

(, 下載次數(shù): 124)
朝南、東南、北的房源是最多的,中國人自古講究房屋坐北向南,無論風(fēng)水還是居住舒適程度,這都會促使居民選擇這一類房子,也同樣促使開發(fā)商盡量開發(fā)朝南、朝北的房子。
2.4 地段分布

(, 下載次數(shù): 122)
龍崗區(qū)的龍崗中心城是房源數(shù)量最多的地段,其次還有寶安區(qū)的西鄉(xiāng)、龍華區(qū)的龍華中心和觀瀾、鹽田區(qū)的沙頭角;

(, 下載次數(shù): 129)
總價(中位數(shù))最高的地段是寶安區(qū)的曦城,其次還有南山區(qū)的紅樹灣和深圳灣、福田區(qū)的香蜜湖和百花;

(, 下載次數(shù): 136)
單價(中位數(shù))最高的地段是南山區(qū)的深圳灣,其次還有福田區(qū)的百花和香蜜湖,南山區(qū)的紅樹灣,寶安區(qū)的寶安中心。
綜合來講,房源數(shù)量最多的地段是龍崗區(qū)、寶安區(qū)和龍華區(qū),房源較多的地段,價格相對而言會便宜一些;而無論是總價和單價,最多的地區(qū)都是南山區(qū)、福田區(qū)和寶安區(qū),這和近年來深圳南山、福田、寶安大力發(fā)展高新科技企業(yè)、吸納高層次人才是密切相關(guān)的。
那為什么龍崗中心城的房源數(shù)量最多呢?
首先,龍崗中心城是龍崗區(qū)的CBD地段,而龍崗區(qū)的房源是全市最多的地區(qū)之一,因此龍崗中心城的房源數(shù)量可觀;
其次,近年來龍崗區(qū)雖然是關(guān)外地區(qū),但發(fā)展勢頭迅猛,GDP接連超過寶安、福田,直逼南山,在經(jīng)濟、人才、建設(shè)、娛樂等多方面絲毫不落下風(fēng),常駐人口逐年上升,預(yù)計還會有更多的房源;
再者,龍崗作為深圳市地域面積最大的一個區(qū)域,擁有大量的土地資源,再加上有地鐵和密集公路網(wǎng)的優(yōu)越交通條件,所以龍崗中心城將會更加完善更加宜居。
總之,龍崗潛力無限。
2.5 裝修分布

(, 下載次數(shù): 134)

上圖是各區(qū)不同裝修類型房源數(shù)量;下圖是不同裝修類型房源與單價和總價的關(guān)系

在深圳二手房市場中,各區(qū)的精裝房占了絕大多數(shù),毛坯房的數(shù)量極少,且兩者的價格都比較高;而簡裝房的單價和總價更低一些。
2.6 房齡分布

(, 下載次數(shù): 105)

圖中的數(shù)字代表各區(qū)該房齡單價的中位數(shù)

a.超過五年的房源占比高;
b.像坪山剛成立不久的地區(qū),房子大多比較新;
c.從數(shù)據(jù)可以看出,老房子和新房子的單價并沒有太大差異,也就是說,房齡并不是造成房子單價差異的原因,這可能是和深圳地少人多,房地產(chǎn)市場一直處于飽滿的狀態(tài)有關(guān)。
六、總結(jié)

1.從區(qū)域來看,福田區(qū)、龍崗區(qū)、羅湖區(qū)、南山區(qū)的二手房房源最多,房源數(shù)量與各區(qū)GDP呈現(xiàn)出某種對數(shù)關(guān)系;南山區(qū)、福田區(qū)、寶安區(qū)的均價位列前三甲,其主要原因是這些地方房價普遍價高再加上大量的異常值,進一步拉高了價格;此外,各區(qū)房源總價中位數(shù)均超過了300W,單價中位數(shù)均超過了35000元/平方;
2.從具體的地段上看,龍崗區(qū)的龍崗中心城是房源數(shù)量最多的地段,其次還有寶安區(qū)的西鄉(xiāng)、龍華區(qū)的龍華中心和觀瀾,這些地段的房源多價格也相對較低,其中龍崗區(qū)的龍崗中心城共有763套房源,總價中位數(shù)390W,單價中位數(shù)38015元/平方。
3.從二手房市場整體來看,絕大部分房源總價在1500W以下,中位數(shù)633W,平均值687W,范圍從24W到8800W;房源單價集中在30K-90K元/平方,中位數(shù)60548元/平方,平均值64893元/平方,范圍從506元/平方到225635元/平方。
4.從二手房特點來看,3室2廳戶型的房源數(shù)量最多,其次是2室1廳;朝南房數(shù)量最多,其次是朝東南和朝北房;超過一半房源面積在50平方-100平方之間;精裝房占了絕大多數(shù),毛坯房的數(shù)量極少且這兩者的價格都比較高,而簡裝房的單價和總價更低一些;除坪山外,老房子(超過五年)的數(shù)量都要比新房子(少于5年)多,老房子和新房子的單價并無太大區(qū)別。

-----------------------------
作者: 盛莊    時間: 2023-3-28 13:45
hi 我對于你爬下來的數(shù)據(jù)非常感興趣,我覺得可以再增加一些指標(biāo),例如地鐵口、學(xué)區(qū)等數(shù)據(jù)也許會有一些更有趣的發(fā)現(xiàn)。您這邊方便一起交流一下嗎?我私信你我的微信。
作者: 熊孩子    時間: 2023-3-28 14:59
方便給一下數(shù)據(jù)嗎




歡迎光臨 愛鋒貝 (http://m.7gfy2te7.cn/) Powered by Discuz! X3.4