|
一鍵注冊(cè),加入手機(jī)圈
您需要 登錄 才可以下載或查看,沒(méi)有帳號(hào)?立即注冊(cè)
x
1. 簡(jiǎn)介
在實(shí)證研究中,我們會(huì)經(jīng)常遇到被解釋變量為 “是/否” 或者 “某事件發(fā)生/未發(fā)生”,此時(shí),被解釋變量只有 兩種 取值,對(duì)應(yīng)的數(shù)字編碼可記為 0 或 1,稱(chēng)為二值變量或 0-1 變量。例如,我們想研究以下問(wèn)題:
- 什么因素會(huì)導(dǎo)致患胃癌(患胃癌 = 1;未患胃癌 = 0)?
- 具有哪些特征的中小企業(yè)會(huì)破產(chǎn)違約還貸(違約 = 1;未違約 = 0)?
- 哪些消費(fèi)者傾向于購(gòu)買(mǎi) iPhone(購(gòu)買(mǎi) iphone = 1;未購(gòu)買(mǎi) iphone = 0)?
- 北京實(shí)施限行政策后哪些家庭會(huì)購(gòu)買(mǎi)第二輛小汽車(chē)(購(gòu)買(mǎi)第二輛車(chē) = 1;未購(gòu)買(mǎi)第二輛車(chē)= 0)?
2. 二元 Logit 模型
對(duì)于某一個(gè)樣本 ,由于被解釋變量 的取值為 0 或者 1 ,我們可以將 視為隨機(jī)變量 的實(shí)現(xiàn)值: 取 1 的概率為 取 0 的概率為 。隨機(jī)變量 服從參數(shù)為 的 (0-1) 分布, 的分布律為
顯然, 若 ,則 的概率為 ; 若 ,則 的概率為 。 易于證明, 的期望和方差分別為:
可見(jiàn), 的期望和方差都決定于 。任何影響概率的因素不但會(huì)影響觀(guān)察值的均值,也會(huì)影響其方差。這就表明線(xiàn)性回 歸模型無(wú)法用于分析二值變量,因?yàn)榫€(xiàn)性回歸模型假設(shè)方差是固定不變的。
為了使上述模型更富有彈性,我們假設(shè)概率 受一系列變量的影響,設(shè)定為 。一個(gè)非常直覺(jué)的想法是把二者之間的關(guān) 系設(shè)定為線(xiàn)性函數(shù):
其中, 個(gè)為系數(shù)向量。該模型通常稱(chēng)為線(xiàn)性概率模型,采用普通最小二乘法估計(jì)即可。其主要缺陷在于: 由于等式左邊 的 表示概率,所以必須介于 0 和 1 之間,而右邊的線(xiàn)性組合項(xiàng)則可能取任何值,所以在不對(duì)模型做嚴(yán)格約束的情況 下,我們很難保證模型的預(yù)測(cè)值介于合理的范圍內(nèi)。
因此,我們必須對(duì)概率 進(jìn)行變換以消除對(duì)其取值范圍的約束,繼而把變換后的數(shù)值設(shè)定為解釋變量 的線(xiàn)性函數(shù)。處 理過(guò)程包括兩個(gè)步驟。
第一步,我們依據(jù)概率 來(lái)定義 勝算比 (odds) :
即 的概率 與 的概率 的比值。顯然,勝算比可以取任意非負(fù)值,如此便可消除上限約束。
第二步,取對(duì)數(shù)以計(jì)算 logit 或 log-odds:
這樣我們就可以去除下限約束。因?yàn)?,隨著概率 趨近于 0 , logit 將趨近于 ; 而當(dāng)概率 趨近于 logit 將趨 近于 。因此,通過(guò)以上變換, 將概率 的取值范圍從 映射至整個(gè)實(shí)數(shù)軸。顯然,如果概率為 ,勝算比為 1 ,相應(yīng)的 log-odds 為 0 。 log-odds 為負(fù)表示概率小于 ,反之則表示概率大于 。
Stata 范例
Stata 提供的 logit 命令可用于估計(jì)上面介紹的二元 logit 模型。這里,我們使用 Stata 附帶的 auto.dta 數(shù)據(jù) (1978 年美國(guó)汽車(chē)數(shù)據(jù)) 來(lái)預(yù)測(cè)汽車(chē)產(chǎn)地 (進(jìn)口= 1;國(guó)產(chǎn)= 0)。以 foreign (是否為進(jìn)口車(chē)) 作為被解釋變量、以 mpg (每加侖汽油能夠行駛的英里數(shù))、weight (汽車(chē)重量) 作為解釋變量,建立二元 logit 模型。Stata 中的命令和結(jié)果如下:
. sysuse "auto.dta", clear
(1978 Automobile Data)
. logit foreign mpg weight
Iteration 0: log likelihood = -45.03321
Iteration 1: log likelihood = -29.238536
Iteration 2: log likelihood = -27.244139
Iteration 3: log likelihood = -27.175277
Iteration 4: log likelihood = -27.175156
Iteration 5: log likelihood = -27.175156
Logistic regression Number of obs = 74
LR chi2(2) = 35.72
Prob > chi2 = 0.0000
Log likelihood = -27.175156 Pseudo R2 = 0.3966
--------------------------------------------------------------------------
foreign | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+----------------------------------------------------------------
mpg | -.1685869 .0919175 -1.83 0.067 -.3487418 .011568
weight | -.0039067 .0010116 -3.86 0.000 -.0058894 -.001924
_cons | 13.70837 4.518709 3.03 0.002 4.851859 22.56487
--------------------------------------------------------------------------
回歸結(jié)果顯示,mpg 與 weight 的系數(shù)值均顯著為負(fù),表明當(dāng)控制其他變量不變時(shí),mpg 與 weight 變量的值分別增加 1 個(gè)單位時(shí), 勝算比 (odds) 將分別變?yōu)樵瓉?lái)的 與 倍,表明該車(chē) 輛是進(jìn)口車(chē)的概率將變小。要獲得這個(gè)變化的倍數(shù)值,即 勝算比,只需在 logit 命令后附加 or 選項(xiàng)即可。Stata 中的命令和結(jié)果如下所示:
. logit foreign mpg weight, or
Iteration 0: log likelihood = -45.03321
Iteration 1: log likelihood = -29.238536
Iteration 2: log likelihood = -27.244139
Iteration 3: log likelihood = -27.175277
Iteration 4: log likelihood = -27.175156
Iteration 5: log likelihood = -27.175156
Logistic regression Number of obs = 74
LR chi2(2) = 35.72
Prob > chi2 = 0.0000
Log likelihood = -27.175156 Pseudo R2 = 0.3966
--------------------------------------------------------------------------
foreign | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
---------+----------------------------------------------------------------
mpg | .8448578 .0776572 -1.83 0.067 .7055753 1.011635
weight | .9961009 .0010077 -3.86 0.000 .9941279 .9980779
_cons | 898396.7 4059594 3.03 0.002 127.9781 6.31e+09
--------------------------------------------------------------------------
note: _cons estimates baseline odds.
Note:Stata 還提供了另一條命令: logistic,可以得到完全相同的結(jié)果。
2.5 邊際效應(yīng)分析
從上面的例子中可以看到,雖然我們能從解釋變量的系數(shù)值判斷該車(chē)輛是進(jìn)口車(chē)的概率值的變化情況,但我們依舊不能直觀(guān)地看出概率值變化的具體數(shù)值。在實(shí)證分析中,我們往往需要計(jì)算出來(lái)解釋變量的變化將對(duì)這輛車(chē)是進(jìn)口車(chē)的概率的變化帶來(lái)的邊際影響值,此時(shí),我們需要使用 margins 命令來(lái)計(jì)算邊際效應(yīng)。
這里,我們介紹實(shí)證分析中常用的兩種邊際效應(yīng):
平均邊際效應(yīng)。 即先分別計(jì)算在每個(gè)樣本觀(guān)測(cè)值上的邊際效應(yīng),然后進(jìn)行簡(jiǎn)單算術(shù)平均得到平均邊際效應(yīng)。 樣本均值處的邊際效應(yīng)。 即先分別計(jì)算各自變量的樣本均值,然后計(jì)算在這一點(diǎn)處的邊際效應(yīng)。
2.5.1 平均邊際效應(yīng)
我們可以使用 margins 命令附加 dydx 選項(xiàng)來(lái)進(jìn)行計(jì)算。Stata 中的命令和結(jié)果如下所示:
. margins, dydx(mpg) //計(jì)算mpg變量對(duì)Pr(foreign)的平均邊際效應(yīng)
Average marginal effects Number of obs = 74
Model VCE : OIM
Expression : Pr(foreign), predict()
dy/dx w.r.t. : mpg
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
mpg | -.0197187 .0096987 -2.03 0.042 -.0387277 -.0007096
------------------------------------------------------------------------------
. margins, dydx(weight) //計(jì)算weight變量對(duì)Pr(foreign)的平均邊際效應(yīng)
Average marginal effects Number of obs = 74
Model VCE : OIM
Expression : Pr(foreign), predict()
dy/dx w.r.t. : weight
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0004569 .0000571 -8.01 0.000 -.0005688 -.0003451
------------------------------------------------------------------------------
- 計(jì)算結(jié)果顯示:當(dāng) mpg 增加 1 個(gè)單位時(shí),車(chē)輛為進(jìn)口車(chē)的概率減少 1.97%;當(dāng) weight 增加 1 個(gè)單位時(shí),車(chē)輛為進(jìn)口車(chē)的概率減少 0.04%
2.5.2 樣本均值處的邊際效應(yīng)
我們可以使用 margins 命令附加 dydx 、atmeans 選項(xiàng)來(lái)進(jìn)行計(jì)算。Stata 中的命令和結(jié)果如下所示:
. margins, dydx(mpg) atmeans //計(jì)算mpg變量對(duì)Pr(foreign)在樣本均值處的邊際效應(yīng)
Conditional marginal effects Number of obs = 74
Model VCE : OIM
Expression : Pr(foreign), predict()
dy/dx w.r.t. : mpg
at : mpg = 21.2973 (mean)
weight = 3019.459 (mean)
-------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
--------+----------------------------------------------------------------
mpg | -.0223512 .0127037 -1.76 0.079 -.04725 .0025476
-------------------------------------------------------------------------
. margins, dydx(weight) atmeans //計(jì)算weight變量對(duì)Pr(foreign)在樣本均值處的邊際效應(yīng)
Conditional marginal effects Number of obs = 74
Model VCE : OIM
Expression : Pr(foreign), predict()
dy/dx w.r.t. : weight
at : mpg = 21.2973 (mean)
weight = 3019.459 (mean)
-------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
--------+----------------------------------------------------------------
weight | -.0005179 .0001389 -3.73 0.000 -.0007902 -.0002457
-------------------------------------------------------------------------
結(jié)果顯示,當(dāng) mpg 的均值 增加 1 個(gè)單位時(shí),車(chē)輛為進(jìn)口車(chē)的概率減少 2.23%;當(dāng) weight 的均值 增加 1 個(gè)單位時(shí),車(chē)輛為進(jìn)口車(chē)的概率減少 0.05%。
詳細(xì)內(nèi)容參見(jiàn)連享會(huì)推文
相關(guān)推文
Note:產(chǎn)生如下推文列表的 Stata 命令為:
. lianxh logit
. songbl logit
安裝最新版 lianxh/ songbl 命令:
. ssc install lianxh, replace
. ssc install songbl, replace
- 專(zhuān)題:Stata 命令
- Stata 新命令:面板-LogitFE-ProbitFE
- 專(zhuān)題:交乘項(xiàng)-調(diào)節(jié)
- Logit-Probit 中的交乘項(xiàng)及邊際效應(yīng)圖示
- 專(zhuān)題:Probit-Logit
- Stata:面板混合選擇模型-cmxtmixlogit
- Logit-Probit:非線(xiàn)性模型中交互項(xiàng)的邊際效應(yīng)解讀
- 秒懂小羅肥歸:logit 與 mlogit 詳解
- reg2logit:用 OLS 估計(jì) Logit 模型參數(shù)
- feologit:固定效應(yīng)有序 Logit 模型
- Stata:多元 Logit 模型詳解 (mlogit)
- Stata:Logit 模型一文讀懂
- 詳解 Logit/Probit 模型中的 completely determined 問(wèn)題
- Stata:Logit 模型評(píng)介
- 二元選擇模型:Probit 還是 Logit?
- Stata:何時(shí)使用線(xiàn)性概率模型而非 Logit?
- Stata:嵌套 Logit 模型 (Nested Logit)
----------------------------- |
|