企业非法集资风险预测第一次周报
本文概述了一般数据挖掘的基本步骤,包括查看数据、填补缺失值、编码、特征选取和模型选取。在查看数据阶段,分析了年报信息中违法与不违法的比例。在处理缺失值时,删除了缺失比例大于0.5的列。接着进行了编码操作,针对object类型和tax数据进行编码。之后进行了数据分桶和交叉特征处理。最终选择了catboost模型进行训练,初步成绩已得出。
摘要由CSDN通过智能技术生成