|
一鍵注冊,加入手機圈
您需要 登錄 才可以下載或查看,沒有帳號?立即注冊
x
1. 簡介
在實證研究中,我們會經(jīng)常遇到被解釋變量為 “是/否” 或者 “某事件發(fā)生/未發(fā)生”,此時,被解釋變量只有 兩種 取值,對應(yīng)的數(shù)字編碼可記為 0 或 1,稱為二值變量或 0-1 變量。例如,我們想研究以下問題:
- 什么因素會導(dǎo)致患胃癌(患胃癌 = 1;未患胃癌 = 0)?
- 具有哪些特征的中小企業(yè)會破產(chǎn)違約還貸(違約 = 1;未違約 = 0)?
- 哪些消費者傾向于購買 iPhone(購買 iphone = 1;未購買 iphone = 0)?
- 北京實施限行政策后哪些家庭會購買第二輛小汽車(購買第二輛車 = 1;未購買第二輛車= 0)?
2. 二元 Logit 模型
對于某一個樣本 ,由于被解釋變量 的取值為 0 或者 1 ,我們可以將 視為隨機變量 的實現(xiàn)值: 取 1 的概率為 取 0 的概率為 。隨機變量 服從參數(shù)為 的 (0-1) 分布, 的分布律為
顯然, 若 ,則 的概率為 ; 若 ,則 的概率為 。 易于證明, 的期望和方差分別為:
可見, 的期望和方差都決定于 。任何影響概率的因素不但會影響觀察值的均值,也會影響其方差。這就表明線性回 歸模型無法用于分析二值變量,因為線性回歸模型假設(shè)方差是固定不變的。
為了使上述模型更富有彈性,我們假設(shè)概率 受一系列變量的影響,設(shè)定為 。一個非常直覺的想法是把二者之間的關(guān) 系設(shè)定為線性函數(shù):
其中, 個為系數(shù)向量。該模型通常稱為線性概率模型,采用普通最小二乘法估計即可。其主要缺陷在于: 由于等式左邊 的 表示概率,所以必須介于 0 和 1 之間,而右邊的線性組合項則可能取任何值,所以在不對模型做嚴格約束的情況 下,我們很難保證模型的預(yù)測值介于合理的范圍內(nèi)。
因此,我們必須對概率 進行變換以消除對其取值范圍的約束,繼而把變換后的數(shù)值設(shè)定為解釋變量 的線性函數(shù)。處 理過程包括兩個步驟。
第一步,我們依據(jù)概率 來定義 勝算比 (odds) :
即 的概率 與 的概率 的比值。顯然,勝算比可以取任意非負值,如此便可消除上限約束。
第二步,取對數(shù)以計算 logit 或 log-odds:
這樣我們就可以去除下限約束。因為,隨著概率 趨近于 0 , logit 將趨近于 ; 而當概率 趨近于 logit 將趨 近于 。因此,通過以上變換, 將概率 的取值范圍從 映射至整個實數(shù)軸。顯然,如果概率為 ,勝算比為 1 ,相應(yīng)的 log-odds 為 0 。 log-odds 為負表示概率小于 ,反之則表示概率大于 。
Stata 范例
Stata 提供的 logit 命令可用于估計上面介紹的二元 logit 模型。這里,我們使用 Stata 附帶的 auto.dta 數(shù)據(jù) (1978 年美國汽車數(shù)據(jù)) 來預(yù)測汽車產(chǎn)地 (進口= 1;國產(chǎn)= 0)。以 foreign (是否為進口車) 作為被解釋變量、以 mpg (每加侖汽油能夠行駛的英里數(shù))、weight (汽車重量) 作為解釋變量,建立二元 logit 模型。Stata 中的命令和結(jié)果如下:
. sysuse "auto.dta", clear
(1978 Automobile Data)
. logit foreign mpg weight
Iteration 0: log likelihood = -45.03321
Iteration 1: log likelihood = -29.238536
Iteration 2: log likelihood = -27.244139
Iteration 3: log likelihood = -27.175277
Iteration 4: log likelihood = -27.175156
Iteration 5: log likelihood = -27.175156
Logistic regression Number of obs = 74
LR chi2(2) = 35.72
Prob > chi2 = 0.0000
Log likelihood = -27.175156 Pseudo R2 = 0.3966
--------------------------------------------------------------------------
foreign | Coef. Std. Err. z P>|z| [95% Conf. Interval]
---------+----------------------------------------------------------------
mpg | -.1685869 .0919175 -1.83 0.067 -.3487418 .011568
weight | -.0039067 .0010116 -3.86 0.000 -.0058894 -.001924
_cons | 13.70837 4.518709 3.03 0.002 4.851859 22.56487
--------------------------------------------------------------------------
回歸結(jié)果顯示,mpg 與 weight 的系數(shù)值均顯著為負,表明當控制其他變量不變時,mpg 與 weight 變量的值分別增加 1 個單位時, 勝算比 (odds) 將分別變?yōu)樵瓉淼? 與 倍,表明該車 輛是進口車的概率將變小。要獲得這個變化的倍數(shù)值,即 勝算比,只需在 logit 命令后附加 or 選項即可。Stata 中的命令和結(jié)果如下所示:
. logit foreign mpg weight, or
Iteration 0: log likelihood = -45.03321
Iteration 1: log likelihood = -29.238536
Iteration 2: log likelihood = -27.244139
Iteration 3: log likelihood = -27.175277
Iteration 4: log likelihood = -27.175156
Iteration 5: log likelihood = -27.175156
Logistic regression Number of obs = 74
LR chi2(2) = 35.72
Prob > chi2 = 0.0000
Log likelihood = -27.175156 Pseudo R2 = 0.3966
--------------------------------------------------------------------------
foreign | Odds Ratio Std. Err. z P>|z| [95% Conf. Interval]
---------+----------------------------------------------------------------
mpg | .8448578 .0776572 -1.83 0.067 .7055753 1.011635
weight | .9961009 .0010077 -3.86 0.000 .9941279 .9980779
_cons | 898396.7 4059594 3.03 0.002 127.9781 6.31e+09
--------------------------------------------------------------------------
note: _cons estimates baseline odds.
Note:Stata 還提供了另一條命令: logistic,可以得到完全相同的結(jié)果。
2.5 邊際效應(yīng)分析
從上面的例子中可以看到,雖然我們能從解釋變量的系數(shù)值判斷該車輛是進口車的概率值的變化情況,但我們依舊不能直觀地看出概率值變化的具體數(shù)值。在實證分析中,我們往往需要計算出來解釋變量的變化將對這輛車是進口車的概率的變化帶來的邊際影響值,此時,我們需要使用 margins 命令來計算邊際效應(yīng)。
這里,我們介紹實證分析中常用的兩種邊際效應(yīng):
平均邊際效應(yīng)。 即先分別計算在每個樣本觀測值上的邊際效應(yīng),然后進行簡單算術(shù)平均得到平均邊際效應(yīng)。 樣本均值處的邊際效應(yīng)。 即先分別計算各自變量的樣本均值,然后計算在這一點處的邊際效應(yīng)。
2.5.1 平均邊際效應(yīng)
我們可以使用 margins 命令附加 dydx 選項來進行計算。Stata 中的命令和結(jié)果如下所示:
. margins, dydx(mpg) //計算mpg變量對Pr(foreign)的平均邊際效應(yīng)
Average marginal effects Number of obs = 74
Model VCE : OIM
Expression : Pr(foreign), predict()
dy/dx w.r.t. : mpg
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
mpg | -.0197187 .0096987 -2.03 0.042 -.0387277 -.0007096
------------------------------------------------------------------------------
. margins, dydx(weight) //計算weight變量對Pr(foreign)的平均邊際效應(yīng)
Average marginal effects Number of obs = 74
Model VCE : OIM
Expression : Pr(foreign), predict()
dy/dx w.r.t. : weight
------------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
-------------+----------------------------------------------------------------
weight | -.0004569 .0000571 -8.01 0.000 -.0005688 -.0003451
------------------------------------------------------------------------------
- 計算結(jié)果顯示:當 mpg 增加 1 個單位時,車輛為進口車的概率減少 1.97%;當 weight 增加 1 個單位時,車輛為進口車的概率減少 0.04%
2.5.2 樣本均值處的邊際效應(yīng)
我們可以使用 margins 命令附加 dydx 、atmeans 選項來進行計算。Stata 中的命令和結(jié)果如下所示:
. margins, dydx(mpg) atmeans //計算mpg變量對Pr(foreign)在樣本均值處的邊際效應(yīng)
Conditional marginal effects Number of obs = 74
Model VCE : OIM
Expression : Pr(foreign), predict()
dy/dx w.r.t. : mpg
at : mpg = 21.2973 (mean)
weight = 3019.459 (mean)
-------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
--------+----------------------------------------------------------------
mpg | -.0223512 .0127037 -1.76 0.079 -.04725 .0025476
-------------------------------------------------------------------------
. margins, dydx(weight) atmeans //計算weight變量對Pr(foreign)在樣本均值處的邊際效應(yīng)
Conditional marginal effects Number of obs = 74
Model VCE : OIM
Expression : Pr(foreign), predict()
dy/dx w.r.t. : weight
at : mpg = 21.2973 (mean)
weight = 3019.459 (mean)
-------------------------------------------------------------------------
| Delta-method
| dy/dx Std. Err. z P>|z| [95% Conf. Interval]
--------+----------------------------------------------------------------
weight | -.0005179 .0001389 -3.73 0.000 -.0007902 -.0002457
-------------------------------------------------------------------------
結(jié)果顯示,當 mpg 的均值 增加 1 個單位時,車輛為進口車的概率減少 2.23%;當 weight 的均值 增加 1 個單位時,車輛為進口車的概率減少 0.05%。
詳細內(nèi)容參見連享會推文
相關(guān)推文
Note:產(chǎn)生如下推文列表的 Stata 命令為:
. lianxh logit
. songbl logit
安裝最新版 lianxh/ songbl 命令:
. ssc install lianxh, replace
. ssc install songbl, replace
- 專題:Stata 命令
- Stata 新命令:面板-LogitFE-ProbitFE
- 專題:交乘項-調(diào)節(jié)
- Logit-Probit 中的交乘項及邊際效應(yīng)圖示
- 專題:Probit-Logit
- Stata:面板混合選擇模型-cmxtmixlogit
- Logit-Probit:非線性模型中交互項的邊際效應(yīng)解讀
- 秒懂小羅肥歸:logit 與 mlogit 詳解
- reg2logit:用 OLS 估計 Logit 模型參數(shù)
- feologit:固定效應(yīng)有序 Logit 模型
- Stata:多元 Logit 模型詳解 (mlogit)
- Stata:Logit 模型一文讀懂
- 詳解 Logit/Probit 模型中的 completely determined 問題
- Stata:Logit 模型評介
- 二元選擇模型:Probit 還是 Logit?
- Stata:何時使用線性概率模型而非 Logit?
- Stata:嵌套 Logit 模型 (Nested Logit)
----------------------------- |
|