机器学习
文章平均质量分 62
Leo_Sheng
这个作者很懒,什么都没留下…
展开
-
无监督学习——聚类算法(Unsupervised learning-clustering)通俗讲解
接触过机器学习(Machine learning)的看官都应该知道机器学习分为监督学习(supervised learning)和无监督学习(unsupervised learning)。通俗的来讲,监督学习是我们提供大量数据,并且这些数据都有其对应的具体标签(或具体的准确值、实际特征对应值),也就是算法中的y,例如:训练集{X,Y}。然后由我们利用回归算法或分类算法对数据进行训练...原创 2018-06-04 23:27:09 · 11551 阅读 · 1 评论 -
多层感知机原理详解 & Python与R实现
转载自:https://www.cnblogs.com/feffery/p/8996623.html ; 博客园网站“费弗里”博主的《数据科学学习手札34》 因作者正在进行电力用户短期负荷预测方向学习,正遇到了多层感知机的应用问题,所以搜到博客园中费弗里博主写的的以下资料,进行转载以便学习查阅。一、简介 机器学习分为很多个领域,其中的连接主义指的就是以神经元(neuron)为...转载 2018-06-22 11:16:58 · 10529 阅读 · 2 评论 -
Python中列表(list)的extend( )和append( )方法区别解析
Python中列表(list)的extend( )和append( )方法区别解析 Python语言列表类型自带的extend( ) 和 append( ) 方法功能类似,但是在处理多个列表时,这两个方法的处理结果是完全不同的。 1、append( ) 方法 假定存在两个列表,a 和 b:a = [1, 2, 3]b = [4, 5, 6]a.append(b)p...原创 2018-06-14 17:06:17 · 482 阅读 · 0 评论 -
XGBoost参数设置中文版及XGBoost的Python模块解释
前言本文来源于 m_buddy 博主的《XGBoost参数解释》博文,进行了简单修改,原文链接。XGBoost参数官方文档:XGBoost Parameters (official guide)。XGBoost的Python模块介绍官方文档:Python Package Introduction在运行XGboost之前, 我们必须设置三种类型的参数: 通用参数(general parameters...原创 2018-06-29 12:02:23 · 4332 阅读 · 0 评论 -
CART(分类回归树)之回归树总结与树剪枝总结
CART(分类回归树)之回归树总结与树剪枝总结 CART(Classification And Regression Trees,分类回归树)与分类算法中决策树ID3算法最大的不同点在于,决策树是一种贪心算法,其要在给定时间内做出最佳选择,但并不关心能否到达全局最优,不能直接处理连续型特征,且决策树特征切分份数由该特征值份数决定;分类回归树采用二元切分法(符合阈值条件进入左子树,否则...原创 2018-06-27 22:40:56 · 1992 阅读 · 0 评论 -
利用Python计算数据的Pearson相关系数
步骤一:读取数据# _*_ coding: utf-8 _*_import pandas as pdimport numpy as npdf = pd.read_csv("D:data1.csv",index_col='user_id')步骤二:异常数据处理(如无需预处理跳过数据预处理程序),进行Pearson相关系数计算运用箱型图分析选出异常值,取前后相邻数据中值替换d...原创 2018-08-30 11:29:44 · 6662 阅读 · 1 评论 -
LightGBM标签特征应用小结
昨天我用LightGBM对一个小数据集进行了回归预测,其中特征部分包含定性特征(标签特征),因为在LightGBM官方文档中看到LightGBM可以通过‘categorical_feature’参数直接处理标签特征,而且计算速度更快,效果更佳。文档参数说明如下:categorical_feature原创 2018-12-05 09:35:53 · 4679 阅读 · 1 评论