統計學系列條目 |
迴歸分析 |
---|
模型 |
估計 |
背景 |
羅吉斯迴歸(英語:Logistic regression,又譯作對數幾率迴歸、羅吉斯迴歸)是一種對數幾率模型(英語:Logit model,又譯作邏輯模型、評定模型、分類評定模型)是離散選擇法模型之一,屬於多重變量分析範疇,是社會學、生物統計學、臨床、數量心理學、計量經濟學、市場營銷等統計實證分析的常用方法。
機器學習與資料探勘 |
---|
對數幾率分佈公式
其中參數常用最大似然估計。
IIA假設
全名為Independent and irrelevant alternatives假設,也稱作IIA效應,指Logit模型中的各個可選項是獨立的。
IIA假設示例
市場上有A,B,C三個商品相互競爭,分別佔有市場份額:60%,30%和10%,三者比例為:6:3:1
一個新產品D引入市場,有能力佔有20%的市場——
如果滿足IIA假設,各個產品獨立作用,互不關聯:新產品D佔有20%的市場份額,剩下的80%在A、B、C之間按照6:3:1的比例瓜分,分別佔有48%,24%和8%。
如果不滿足IIA假設,比如新產品D跟產品B相似度高,則新產品D的CP值高而奪去產品B的部分市場(總份額的20%),則產品B剩餘10%,而產品A和C的市場份額保持60%和10%不變。
滿足IIA假設的優點
IIA假設的檢驗
Hausman檢驗
一般化模型的檢驗
IIA問題的解決方法
多項式Probit模型
一般化極值模型
可以將可選項間的相關性建模
巢式Logit模型
巢式(Nested)表示可選項被分作不同的組,組與組之間不相關,組內的可選項相關,相關程度用1-λg來表示(1-λg越大,相關程度越高)
對偶組合Logit模型
一般化分簇Logit模型
混合Logit模型
二類評定模型(Binary Logit Model)
- 僅有兩個可選項:V1n,V2n
變量類型 |
統計量 |
組別比較 |
迴歸模型 |
---|---|---|---|
numerical
|
mean
|
t-test/ANOVA
|
線性迴歸
|
categorical
|
percentage
|
Chi-square test
|
邏輯迴歸
|
persontime
|
KM estimates (survival curves) |
Log-rank test
|
比例風險迴歸
|
參考書目
- Agresti, Alan: Categorical Data Analysis. New York: Wiley, 1990.
- Amemiya, T., 1985, Advanced Econometrics,Harvard University Press.
- Hosmer, D. W. and S. Lemeshow: Applied logistic regression. New York; Chichester, Wiley, 2000.