# 計(jì)算每個(gè)地區(qū)雙體船的掛牌數(shù)量
catamarans_region_counts = catamarans_df['Geographic Region'].value_counts()
print("Catamarans region counts:")
print(catamarans_region_counts)
由此,我們可以看到,美國的單體船掛牌數(shù)量最多,而加勒比海的雙體船掛牌數(shù)量最多。我們還可以看到,單船和雙體船在各個(gè)地區(qū)的列表分布是不一樣的,例如,歐洲的單船列表比雙體船多,而加勒比海的雙體船列表比單船多。
為了分析地域?qū)ι鲜袃r(jià)格的影響,我們可以使用以地域?yàn)榉诸愵A(yù)測(cè)變量的線性回歸模型。我們可以加入其他相關(guān)的預(yù)測(cè)變量,如長度和年份,以控制它們對(duì)上市價(jià)格的影響。
import statsmodels.api as sm