PYTHON大数据分析-IWC赛题

本文是关于参加IWC赛题1(企业投资价值评估)的数据分析总结,主要介绍了数据清洗、模型选型、参数调优、模型校验和结果预测的过程。作者强调了数据清洗的重要性,选择了随机森林作为最佳模型,并分享了比赛心得。
摘要由CSDN通过智能技术生成

PYTHON大数据分析-IWC赛题1(企业投资价值评估)数据分析方法总结

  • 一、目的
  • 二、代码结构简述
  • 三、数据分析过程
    • 1、数据清洗
    • 2、模型选型
    • 3、参数调优
    • 4、模型校验
    • 5、结果预测
  • 四、比赛心得

一、目的

本次比赛主要解决的问题是根据官方提供的37个EXCEL表信息与企业评分,训练出一个模型,使之能够根据对新企业进行评分估计。
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190427000847165.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1p1b0ZlbmdZZUNhbw==,size_16,color_FFFFFF,t_70)
表格的数据是这样的 ![在这里插入图片描述](https://img-
blog.csdnimg.cn/20190427000806345.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1p1b0ZlbmdZZUNhbw==,size_16,color_FFFFFF,t_70)
企业评分是这样的
![在这里插入图片描述](https://img-blog.csdnimg.cn/20190427001034340.png?x-oss-
process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L1p1b0ZlbmdZZUNhbw==,size_16,color_FFFFFF,t_70)

二、代码结构简述

整个工程包括原始数据(excel_sources)、训练数据(test_data)、算法(algorithm)、数据清洗(Data_Processing)
四个部分,如下图:
在这里插入图片描述

  1. Algorithm ,包含目前测试中使用到的算法模型,可通过在main.py中通过train函数注释来选择训练的算法
    ![在这里插入图片描述](https://img-blog.csdnimg.cn/20190427001620914.png?x-oss-
    process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aH
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值