automl以及lightgbm处理财务金融数据

最新推荐文章于 2023-12-24 14:35:50 发布

qian笑

最新推荐文章于 2023-12-24 14:35:50 发布

阅读量187

点赞数

分类专栏：团队学习笔记文章标签：金融

本文链接：https://blog.csdn.net/qq2352/article/details/127254757

版权

团队学习笔记专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

- 一、特征工程
- 二、模型参数寻找

一、特征工程

通过pandas语法将一些用浮点数字表示的类别列重设为category或者int可能会更好，不一定暂时不需要。在原始的dataframe中的整数基本上时类别除了（‘Timeliness of Financial Reporting’, '公司年龄 ’ ,'上市年数 '）分别对应6，10，11。验证得到基本不会影响结果
一些仅有一个值的列将会被删除以及一些副本列也会被删除

自定义特征工程看下面的文件：
examples/tabular/example_custom_feature_generator.py.

f3与f2,f1的分布有比较大的差别，故f3的效果较差

二、模型参数寻找

#选中特定的一些模型
model_indx = 2
model_to_use = predictor.get_model_names()[model_indx]
specific_model = predictor._trainer.load_model(model_to_use)
model_info = specific_model.get_info()

具体点可以看sitepackget的autogluon的源码

qian笑

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
automl以及lightgbm处理财务金融数据

通过pandas语法将一些用浮点数字表示的类别列重设为category或者int可能会更好，不一定暂时不需要。在原始的dataframe中的整数基本上时类别除了（‘Timeliness of Financial Reporting’, '公司年龄 ’ ,'上市年数 '）分别对应6，10，11。验证得到基本不会影响结果。具体点可以看sitepackget的autogluon的源码。f3与f2,f1的分布有比较大的差别，故f3的效果较差。一些仅有一个值的列将会被删除以及一些副本列也会被删除。
复制链接

扫一扫

专栏目录