数据处理与分析(数据挖掘)
文章平均质量分 52
Leo_Sheng
这个作者很懒,什么都没留下…
展开
-
多层感知机原理详解 & Python与R实现
转载自:https://www.cnblogs.com/feffery/p/8996623.html ; 博客园网站“费弗里”博主的《数据科学学习手札34》 因作者正在进行电力用户短期负荷预测方向学习,正遇到了多层感知机的应用问题,所以搜到博客园中费弗里博主写的的以下资料,进行转载以便学习查阅。一、简介 机器学习分为很多个领域,其中的连接主义指的就是以神经元(neuron)为...转载 2018-06-22 11:16:58 · 10512 阅读 · 2 评论 -
Python时间序列缺失值处理(日期缺失填充)完全教程-附Python完整例程
前言因近期进行时间序列分析时遇到了数据预处理中的缺失值处理问题,其中日期缺失和填充在网上没有找到较好较全资料,耗费了我一晚上工作时间,所以下面我对这次时间序列缺失值处理学习做了以下小结以供之后同行们参考指正。时间序列缺失值处理一、编程前准备 收集时间序列数据,相信看这篇博客的各位已经完成了这步。 需要安装pandas模块,并利用Python的Lib文...原创 2018-10-23 22:39:09 · 25500 阅读 · 9 评论 -
异常数据处理——箱型图分析原理及Python例程
箱型图分析原理及Python例程 一、箱型图分析原理箱型图可以通过程序设置一个识别异常值的标准,即大于或小于箱型图设定的上下界的数值则识别为异常值,箱型图如下图所示:首先我们定义下上四分位和下四分位:上四分位我们设为 U,表示的是所有样本中只有1/4的数值大于U ,即从大到小排序时U处于25%处;同理,下四分位我们设为 L,表示的是所有样本中只有1/4的数值小于L,即从大到小...原创 2018-07-17 09:36:38 · 4786 阅读 · 0 评论 -
Python 中的 random.uniform( ) 函数教程与实例解析
random.uniform( ) 函数教程与实例解析1. uniform( ) 函数说明random.uniform(x, y) 方法将随机生成一个实数,它在 [x,y] 范围内。2. uniform( ) 的语法与参数2.1 语法# _*_ coding: utf-8 _*_import randomrandom.uniform(x, y)或# _*_ coding: utf-8 _*_...原创 2018-06-20 09:51:15 · 86881 阅读 · 5 评论 -
Python_sklearn库教程与例程
Python_sklearn数据集转换之预处理数据: 将输入的数据转化成机器学习算法可以使用的数据。包含特征提取和标准化。 原因:数据集的标准化(服从均值为0方差为1的标准正态分布(高斯分布))是大多数机器学习算法的常见要求。 如果原始数据不服从高斯分布,在预测时表现可能不好。在实践中,我们经常进行标准化(z-score 特征减去均值/标准差)。1.1 标准正态分布(...转载 2018-05-31 23:30:00 · 1479 阅读 · 0 评论 -
Python中列表(list)的extend( )和append( )方法区别解析
Python中列表(list)的extend( )和append( )方法区别解析 Python语言列表类型自带的extend( ) 和 append( ) 方法功能类似,但是在处理多个列表时,这两个方法的处理结果是完全不同的。 1、append( ) 方法 假定存在两个列表,a 和 b:a = [1, 2, 3]b = [4, 5, 6]a.append(b)p...原创 2018-06-14 17:06:17 · 479 阅读 · 0 评论 -
LightGBM标签特征应用小结
昨天我用LightGBM对一个小数据集进行了回归预测,其中特征部分包含定性特征(标签特征),因为在LightGBM官方文档中看到LightGBM可以通过‘categorical_feature’参数直接处理标签特征,而且计算速度更快,效果更佳。文档参数说明如下:categorical_feature原创 2018-12-05 09:35:53 · 4662 阅读 · 1 评论