![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
c.x.y.07.30
这个作者很懒,什么都没留下…
展开
-
财务造假判断+面试+车牌识别
一、线上赛题 题目:判断企业财务是否造假 难点:类别不均衡,造假类远少于非造假类,大概比例为70:1 主要步骤 1.数据预处理 一共36列,其中公司代码列作为索引,没有使用。fake列作为预测的标签列。还剩下34列。查看基本信息,发现投资收益利润比有两条缺失值,进行删除。 2.对于数据分类不平衡的问题,通常可以通过欠采样、过采样或者加入惩罚函数的方法来解决。 欠采样是指通过减少...原创 2020-04-22 13:39:04 · 488 阅读 · 1 评论 -
异常值检测方法
一、异常值是指什么?请列举识别连续型变量异常值的方法? 答:异常值是指样本中的个别值,其数值明显偏离所属样本的其余观测值。在数理统计里一般是指一组观测值中与平均值的偏差超过两倍标准差的测定值。 常用的检验法有(按优劣次序): (1)t检验法 (2)格拉布斯检验法 (3)峰度检验法 (4)狄克逊检验法 (5)偏度检验法 ...原创 2019-08-29 14:40:31 · 1163 阅读 · 0 评论