对分类问题的研究大部分是在样本分布均衡的情况下开展的。比如对二分类,一般研究的是正样本和负样本的数量相当(比如各占50%)或者相差不是那么大(比如一类样本占30%,另一类样本占70%)。但在实际应用时,经常会碰到样本倾斜问题,对于二分类而言,就会是某类的样本比例远小于另一类的样本比例。在学术界,一般称样本少的那类为正类,称正类代表的随机事件为稀有事件。稀有事件的例子并不少,比如发生战争的概率,染上某种不常见疾病的概率,磁盘出现故障的概率,网络传输数据丢失的概率等。
小编今日分享一下稀有事件逻辑回归relogit安装教程
首先,请大家打开https://gking.harvard.edu/relogit网站,点击下载ado文件
第二步,打开Stata软件,搜索安装路径