PYTHON大数据分析-IWC赛题1(企业投资价值评估)数据分析方法总结
- 一、目的
- 二、代码结构简述
- 三、数据分析过程
-
- 1、数据清洗
- 2、模型选型
- 3、参数调优
- 4、模型校验
- 5、结果预测
- 四、比赛心得
一、目的
本次比赛主要解决的问题是根据官方提供的37个EXCEL表信息与企业评分,训练出一个模型,使之能够根据对新企业进行评分估计。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190427000847165.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1p1b0ZlbmdZZUNhbw==,size_16,color_FFFFFF,t_70)
表格的数据是这样的 ![在这里插入图片描述](https://img-
blog.csdnimg.cn/20190427000806345.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1p1b0ZlbmdZZUNhbw==,size_16,color_FFFFFF,t_70)
企业评分是这样的
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190427001034340.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1p1b0ZlbmdZZUNhbw==,size_16,color_FFFFFF,t_70)
二、代码结构简述
整个工程包括原始数据(excel_sources)、训练数据(test_data)、算法(algorithm)、数据清洗(Data_Processing)
四个部分,如下图:
- Algorithm ,包含目前测试中使用到的算法模型,可通过在main.py中通过train函数注释来选择训练的算法
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190427001620914.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aH