第四周周报

最新推荐文章于 2022-11-05 11:48:16 发布

HaiRG

最新推荐文章于 2022-11-05 11:48:16 发布

阅读量419

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HaiRG/article/details/109189421

版权

第四周周报

在上一周中，我完成的内容主要有：数据处理以及模型选择与数据训练。

数据处理

我对于原数据中一些字符型数据，转换为数值型数据，如：

employmentLength列中的< 1 year 与 10+ years，我首先将其转换为0 year与10 year，然后，只取数字部分，这样讲字符转换为了数值。
对于subGrade，我将其从A1到G5映射到了1到35。

我还将原数据中一些列删除，降低数据的维度，加快训练速度，并同时排除掉一些与结果无关的列，如id’,‘isDefault’,‘policyCode’,‘grade’，这些列或者只是唯一标识，或者只有单一值存在，或者有更详细的列代替，因此我将这些列删除。

模型选择

我采用的是lightgbm模型，它是GBDT的高效实现，主要具有简洁高效，占用内存少，支持并行化处理的特征。
我利用sklearn的train_test_split函数，将训练集进行划分，用于度量训练结果。
对于目前初步得到的结果，在比赛中的排名是：
在这里插入图片描述
在接下来的时间里，我主要需要对模型的参数进行进一步的优化，可以采用贝叶斯或者其他方法进行调整。另外，我需要对数据进行进一步的处理，我觉得通过数据处理可以更好地取得更优秀的结果。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
第四周周报

第四周周报在上一周中，我完成的内容主要有：数据处理以及模型选择与数据训练。数据处理我对于原数据中一些字符型数据，转换为数值型数据，如：employmentLength列中的< 1 year 与 10+ years，我首先将其转换为0 year与10 year，然后，只取数字部分，这样讲字符转换为了数值。对于subGrade，我将其从A1到G5映射到了1到35。我还将原数据中一些列删除，降低数据的维度，加快训练速度，并同时排除掉一些与结果无关的列，如id’,‘isDefault’,‘po
复制链接

扫一扫

HaiRG CSDN认证博客专家 CSDN认证企业博客

码龄7年

35: 原创

16万+: 周排名

189万+: 总排名

3万+: 访问

: 等级

599: 积分

3: 粉丝

5: 获赞

0: 评论

14: 收藏

私信

关注

热门文章

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。