![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 68
段墨染
一努力努力学习的菜鸟
展开
-
Python 比较实用的一些数据处理方法
记录下平时在进行数据处理所遇到的一些问题和解决方法:1.merge合并表格数据使用pd.merge合并两个datafrme数据时,会多出数据条数来。可使用drop_duplicates()函数去掉重复数据。2.对于datafrme数据在固定某列后添加数据: col_name=data.columns.tolist() #获取数据的列名 col_name.insert(col_name.index('A')+1, 'B') #在 A 列后面插入B data = data.reinde原创 2021-08-19 11:11:13 · 685 阅读 · 0 评论 -
机器学习sklearn实战-----随机森林调参乳腺癌分类预测
机器学习sklearn随机森林乳腺癌分类预测机器学习中调参的基本思想:1)非常正确的调参思路和方法2)对模型评估指标有深入理解3)对数据的感觉和经验文章目录机器学习sklearn随机森林乳腺癌分类预测随机森林原理一、随机森林模型预测1.未调参时模型精确度2.调整n_estimators参数二、使用网格搜索调参正确的调参思路RandomForestClassifier重要参数泛化误差参数对泛化误差的影响随机森林原理随机森林指的是利用多棵树对样本进行训练并预测的一种分类器。在机器学习中,随机森原创 2020-10-14 15:34:41 · 3750 阅读 · 5 评论 -
机器学习sklearn实战-----泰坦尼克号分类预测决策树
机器学习sklearn实战—决策树决策树理论、基础、调参、以及实例泰坦尼克号预测文章目录机器学习sklearn实战---决策树前言一、Sklearn入门?二、决策树1.决策树的原理2.sklearn中的决策树3.红酒数据进行分类决策树实战之泰坦尼克号预测分类总结前言 机器学习,sklearn入门与决策树实战一、Sklearn入门?官网:https://scikit-learn.org二、决策树1.决策树的原理决策树算法的核心是要解决两个问题:1)如何从数据表中找到最佳节点和最原创 2020-10-13 21:09:12 · 2227 阅读 · 1 评论 -
Python数据分析实战之用户模式识别
Python数据分析实战之用户模式识别实战项目利用防窃漏电模型,通过采集电量异常、负荷异常、终端报警、主站报警、线损异常等信息,建立数据分析模型 构建基于指标加权的用电异常分析模型,实现检查客户是否存在违章用电情况。利用拉格朗日插值对空白数据进行填补自定义函数利用scipy中自带的拉格朗日插值函数对空白数据进行填补,主要是取前后5个数进行插值填补。def data_make(): #对数据进行预处理 利用拉格朗日插值法 inputdata = "G:\\机器学习\\python_dat原创 2020-08-08 00:22:54 · 607 阅读 · 1 评论