数据分析
weixin_43559291
这个作者很懒,什么都没留下…
展开
-
数据竞赛(五)-模型融合
sklearn 交叉验证K折交叉验证:sklearn.model_selection.KFold(n_splits=3, shuffle=False, random_state=None)思路:将训练/测试数据集划分n_splits个互斥子集,每次用其中一个子集当作验证集,剩下的n_splits-1个作为训练集,进行n_splits次训练和测试,得到n_splits个结果注意点:对于不能均...原创 2020-01-19 19:19:24 · 269 阅读 · 0 评论 -
数据竞赛(四)-模型选择
使用lightGBM为例,相对于XGBoost算法,降低了运行速度。Lightgbm基本原理介绍具体代码展示:from __future__ import print_functionimport lightgbm as lgbimport sklearnimport numpyimport hyperoptfrom hyperopt import hp, fmin, tpe, S...原创 2020-01-16 07:06:34 · 314 阅读 · 0 评论 -
pandas 入门 5.1 章
pandas 经常是和其他数值计算工具一起使用,比如 Numpy 和 SciPy 以及数据可视化工具比如 matplotlib。pandas 数据结构介绍两个常用的工具数据结构:Series 和 DataFrameSeriesSeries 是一种一维的数组型对象,它包含了一个值序列,并且包含了数据标签。In [1]: import pandas as pdIn [2]: obj = ...原创 2019-09-27 19:50:31 · 118 阅读 · 0 评论