自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (30)
  • 收藏
  • 关注

原创 聚类算法(K-Means和DBSCAN)

聚类算法(K-Means和DBSCAN)目录一、无监督学习与聚类算法1、旨在理解数据自然机构的聚类2、用于数据处理的聚类二、核心概念1、聚类分析2、簇三、基于原型的技术:K-Means1、基于原型的簇2、K-means的基本定义3、算法执行细节四、使用sklearn实现K-Means1、重要参数:n_clusters2、聚类算法的模型评估指标:轮廓系数3、案例:基础轮...

2019-12-29 18:48:17 5616

原创 决策树 Decision Tree

决策树 Decision Tree一、学习决策树1、决策树模型2、学习算法二、 特征选择1、香农熵2、信息增益3、划分数据集三、决策树的生成1、ID3算法2、C4.5算法四、决策树的拟合度优化1、欠拟合和过拟合2、决策树剪枝五、CART算法六、sklearn实现决策树七、分类模型的评估指标1、二分类决策树中的样本不不均衡问题2、混淆矩阵八、决策树算法评价一...

2019-12-29 12:09:40 1512

原创 线性回归原理

线性回归目录一、线性回归介绍二、多元线性回归1、原理2、最小二乘法求解多元线性回归的参数3、sklearn练习三、回归类模型评估指标1、是否预测到了正确的数值2、是否拟合到了足够的信息四、岭回归和Lasso1、多重共线性2、岭回归3、Lasso一、线性回归介绍回归是一种应用广泛的预测建模技术,这种技术的核心在于预测的结果是连续型变量。KNN这样的分类算法的预测标签是分...

2019-12-01 17:15:42 1368

原创 网格搜索(GridSearch)及参数说明,实例演示

网格搜索(GridSearch)及参数说明,实例演示一)GridSearchCV简介网格搜索(GridSearch)用于选取模型的最优超参数。获取最优超参数的方式可以绘制验证曲线,但是验证曲线只能每次获取一个最优超参数。如果多个超参数有很多排列组合的话,就可以使用网格搜索寻求最优超参数的组合。网格搜索针对超参数组合列表中的每一个组合,实例化给定的模型,做cv次交叉验证,将平均得分最高的超参数...

2019-11-17 14:24:09 10147

原创 逻辑回归

逻辑回归目录一、概述1、介绍2、作用二、sklearn 中逻辑回归1、二元逻辑回归的损失函数2、重要参数penalty & C3、梯度下降:重要参数max_iter一、概述1、介绍我们接触了不少带“回归”二字的算法,回归树,随机森林的回归,线性回归,无一例外他们都是区别于分类算法们,用来处理和预测连续型标签的算法。然而逻辑回归,是一种名为“回归”的线性分类器,其本质是...

2019-10-19 14:33:56 519

原创 机器学习最简单算法——KNN算法(K-Nearest Neighbor)

机器学习最简单算法——KNN算法(k-Nearest Neighbor)一、学习算法二、KNN算法(k-Nearest Neighbor)三 、sklearn算法库(scikit-learn)四、学习曲线五、交叉验证六、归一化七、距离惩罚八、KNN模型评价九、模型的追求一、学习算法机器学习的方法是基于数据产生的"模型"(model)的算法,也称"学习算法"(learning...

2019-10-19 14:29:47 3919 2

原创 缺失值了解与简单处理

缺失值处理目录一、缺失值的概括二、缺失值的产生三、缺失值处理四、对含有缺失值的列转换后的影响一、缺失值的概括缺失值从缺失的分布来讲可以分为完全随机缺失,随机缺失和完全非随机缺失。完全随机缺失(missing completely at random,MCAR)指的是数据的缺失是随机的,数据的缺失不依赖于任 何不完全变量或完全变量。例如一个班有五名同学的数学成绩缺失,缺失原因是课代表...

2019-09-21 11:26:21 1344

原创 Python 数据可视化之matpotlib画图

Python 数据可视化之matpotlib画图目录一、建立画布和坐标系二、解决中卫乱码问题三、介绍多种绘图方法以折线图为例四、多种图形的绘制方法1、折线图2、条形图3、面积图4、填图5、饼图6、直方图和核密度图7、散点图8、箱线图9、雷达图五、图形保存六、拓展图形一、建立画布和坐标系#导入绘图所用的相关库 import numpy as np import...

2019-09-21 11:24:05 737

原创 流程控制语句

流程控制语句一、顺序结构二、分支结构三、循环结构1、while循环2、for循环3、终止语句4、占位语句5、综合练习一、顺序结构顺序结构就是普通的⾃上⽽下运⾏的代码结构。a = '顺序结构'print(a)b = '⾃上⽽下'print(b)c = '逐条运⾏'print(c)二、分支结构⼜称为条件控制语句。Python条件语句是通过⼀条或多条语句的执⾏结果(...

2019-09-21 11:20:33 205

原创 python爬虫

python爬虫一、爬虫基本概念:​ 1、爬虫法律问题​ 2、爬虫定义​ 3、通用爬虫和聚焦爬虫的区别与联系​ 4、url的搜索策略(基于ip地址搜索,广度优先,深度优先,最佳优先)二、网页的基础知识:​ 1、url的概念​ 2、http和https​ 3、http的请求过程​ 4、请求,四部分内容:​ 5、响应,三部分内容:​ 6、网页构成:三、...

2019-09-21 11:17:07 748

原创 爬虫 selenium

selenium一、声明浏览器对象二、打开网页,进入百度三、查找元素四、获取元素信息,获取属性五、元素的交互六、下拉进度条七、动作链八、等待九、浏览器的前进的后退十、选项卡管理十一、异常处理十二、常用键的操作十三、登录操作十四、爬取京东商品,爬取一页十五、爬取多页十六、无界面模式十七、股票代码抓取一、声明浏览器对象#声明浏览器对象import osos.c...

2019-09-21 11:12:29 223

原创 日期时间变量的处理

日期时间变量的处理一、时间戳Timestame对象二、获取当前时间三、时间戳实例的属性和方法四、计算时差Timedelta实例五、生成时间戳范围六、数据框内对时间变量的操作七、滞后一期和先导一期八、日期时间变量做数据框的索引一、时间戳Timestame对象#导入相关库 import pandas as pd import numpy as np import time ...

2019-09-21 11:08:57 2376

原创 数据框的合并排序、描述统计、分箱

数据框的合并排序、描述统计、分箱一、表合并二、数据框排序三、描述性统计四、变量与索引的相互转化五、分箱六、分类变量转虚拟变量七、数据框对象的复制八、字符串变量的常用方法九、删除重复项十、数据抽样一、表合并1、纵向合并# 导入库import pandas as pdimport numpy as np#建立两个表data1=pd.DataFrame(np.rando...

2019-09-20 17:44:36 469

原创 异常、模块、文件读写

异常、模块、文件读写目录一、 异常二、模块三、文件读写一、 异常Python 使用被称为异常的特殊对象来管理程序执行期间发生的错误。每当发生让 Python 不知所措的错误时,它都会创建一个异常对象。如果你编写了处理该异常的代码,程序将继续运行;如果你未对异常进行处理,程序将停止,并显示一个 traceback ,其中包含有关异常的报告。1、常见异常除零错误ZeroDivisi...

2019-09-20 17:42:28 398

原创 学习python内一般函数知识

函数目录一、函数定义二、函数编写说明文档三、函数的返回值四、函数参数1、位置参数与关键字参数2、默认参数3、可变长参数4、可变关键字参数五、作用域1、全局变量2、局部变量3、global关键字4、内嵌函数与 nonlocal关键字5、闭包6、递归7、lambda匿名函数一、函数定义In [17]:def info_1(a,b,c): print(a)...

2019-09-20 09:57:40 142

原创 pandas 数据结构与基础功能

pandas 数据结构与基础功能目录一、series 对象1、生成2、切片3、series类型的转换二、DataFrame(数据框)对象1、生成2、导入外部文件3、查看数据框信息4、数据框对象的索引和切片5、删除和新增6、数据框修改列名7、数据框对象的导出一、series 对象1、生成import pandas as pdimport numpy as npp...

2019-09-20 09:49:31 187

原创 Python基础数据类型

基础数据类型目录一、布尔型(bool)二、数字(number)1、整数型(int)2、浮点数(float)3、分数4、复数三、字符串(str)1、字符串运算符2、转义字符3、多行字符串4、索引与切片5、字符串方法6、函数四、表达式与运算符1、运算符2、math计算科学库五、列表(list)1、索引和切片2、列表的常用方法3、列表的拼接和重复4、成员资格...

2019-09-20 09:44:56 349

原创 numpy库

numpy库目录一、数组1、数组创建2、数组属性3、缺失值问题4、特殊数组5、np.random 模块6、数组的排序7、数组的重塑8、索引和切片9、数组的合并10、数组的运算二、np下面的通用函数三、ndarry实例的常用方法四、np.char模块下面的字符串函数五、矩阵运算、协方差####六、np其他常用函数一、数组1、数组创建import numpy a...

2019-09-20 09:31:10 403

原创 numpy库学习总结

numpy库目录一、数组1、数组创建2、数组属性3、缺失值问题4、特殊数组5、np.random 模块6、数组的排序7、数组的重塑8、索引和切片9、数组的合并10、数组的运算二、np下面的通用函数三、ndarry实例的常用方法四、np.char模块下面的字符串函数五、矩阵运算、协方差六、np其他常用函数一、数组1、数组创建import numpy as np...

2019-09-20 09:26:36 726

原创 pandas 数据结构与基础功能

pandas 数据结构与基础功能目录一、series 对象1、生成2、切片3、series类型的转换二、DataFrame(数据框)对象1、生成2、导入外部文件3、查看数据框信息4、数据框对象的索引和切片5、删除和新增6、数据框修改列名7、数据框对象的导出一、series 对象1、生成import pandas as pdimport numpy as npp...

2019-09-01 15:46:53 189

原创 日期时间变量的处理

日期时间变量的处理一、时间戳Timestame对象二、获取当前时间三、时间戳实例的属性和方法四、计算时差Timedelta实例五、生成时间戳范围六、数据框内对时间变量的操作七、滞后一期和先导一期八、日期时间变量做数据框的索引一、时间戳Timestame对象[外链图片转存失败(img-Se1ckLpq-1567321546684)(D:\学习知识整理\Python\图片\日期时间...

2019-09-01 15:44:51 1325

原创 数据框的合并排序、描述统计、分箱

数据框的合并排序、描述统计、分箱一、表合并二、数据框排序三、描述性统计四、变量与索引的相互转化五、分箱六、分类变量转虚拟变量七、数据框对象的复制八、字符串变量的常用方法九、删除重复项十、数据抽样一、表合并1、纵向合并# 导入库import pandas as pdimport numpy as np#建立两个表data1=pd.DataFrame(np.rando...

2019-09-01 15:43:33 545

原创 Python 基础数据类型

基础数据类型目录一、布尔型(bool)二、数字(number)1、整数型(int)2、浮点数(float)3、分数4、复数三、字符串(str)1、字符串运算符2、转义字符3、多行字符串4、索引与切片5、字符串方法6、函数四、表达式与运算符1、运算符2、math计算科学库五、列表(list)1、索引和切片2、列表的常用方法3、列表的拼接和重复4、成员资格...

2019-08-27 22:52:35 227

原创 Python 函数

函数一、函数定义二、函数编写说明文档三、函数的返回值四、函数参数1、位置参数与关键字参数2、默认参数3、可变长参数4、可变关键字参数五、作用域1、全局变量2、局部变量3、global关键字4、内嵌函数与 nonlocal关键字5、闭包6、递归7、lambda匿名函数一、函数定义In [17]:def info_1(a,b,c): print(a) ...

2019-08-27 22:51:03 187

原创 逻辑回归

逻辑回归推导我们在讲逻辑回归推导前,先给大家介绍下损失函数损失函数用于描述模型预测值与真实值的差距大小。一般对于回归问题的算法有—均值平方差(MSE)和交叉熵。1、均值平方差均值平方差(Mean Squared Error,MSE),也称“均方误差”,在神经网络中主要是表达预测值和真实值之间的差异,在数理统计中,均方误差是指参数估计值与参数真值之差平方的预期值。2、交叉熵交叉熵(cro...

2019-08-17 14:51:00 385

原创 用PBD制作餐饮店KPI分析仪-入门篇

一、案例概述本次案例数据是某连锁餐饮的日销售情况,原始数据分为三个表,分别为单号详细表、点菜明细表和店面情况表,基于已经提供的数据做一个店面KPI分析仪。1、 原始数据关注表结构、内容的完整性,记住格式(案例为表格格式),导入PBD时需要选择。(1)单号详细表(2)点菜明细表(3)店面情况表2、思路分析下图是相关KPI内容解析,大致思路是通过处理原始数据得到KPI里面的内容,...

2019-07-28 11:58:52 848

聚类算法(K-Means和DBSCAN).md

介绍无监督学习与聚类算法,分别介绍了基于原型的技术的K-Means和基于密度的聚类算法的DBSCAN,分别讲明了他们的原理并在sklearn库使用python进行演示,介绍了一些重要参数并加以说明。

2019-12-29

决策树 Decision Tree.md

本文档主要描述决策树的生成、剪枝和特征选择,分别结=介绍了ID3、CHAT树和C4.5算法,并在sklearn实现决策树,最后介绍了混淆矩阵,算法评价。

2019-12-15

线性回归原理介绍.md

线性回归算法原理,最小二乘法求解多元线性回归的参数,在sklearn库实现,回归类模型评估指标,最后介绍了下岭回归和lasso。

2019-12-01

网格搜索(GridSearch)及参数说明,实例演示.md

网格搜索参数说明,数据集演示,当超参数过多,我们可以使用网格搜索一次性把最优的超参数组合列出来,skearn中超参数网格搜索方法grid Serach

2019-11-17

逻辑回归算法.md

机器学习之逻辑回归原理,重要参数penalty & C,调用sklearn库实现,梯度下降推导。

2019-10-18

机器学习最简单算法——KNN算法(k-Nearest Neighbor).md

机器学习算法-KNN最近邻,文章介绍机器学习入门基础,包括有监督、无监督、强学习等,介绍KNN算法原理。

2019-10-18

异常、模块、文件读写

入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

数据框的合并排序、描述统计、分箱

入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

日期时间变量的处理

入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

缺失值处理

入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

爬虫 selenium

爬虫入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

流程控制语句

入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

Python函数

入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

python爬虫

入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

Python基础数据类型

入门级基础知识,本人学习整理笔记,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

Python 数据可视化之matpotlib画图

入门级基础知识,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

pandas 数据结构与基础功能

入门级基础知识,对小白很友好,有兴趣的学习的朋友可以查阅。

2019-09-13

学习numpy库

入门学习numpy,对小白很友好,有兴趣的朋友可以查阅。

2019-09-13

数据框的合并排序、描述统计、分箱.md

介绍数据的操作,包括合并、排序、描述统计、分箱处理。

2019-09-01

日期时间变量的处理.md

介绍日期时间变量,时间戳Timestame对象的属性和方法,在数据框内对时间变量的操作等

2019-09-01

pandas 缺失值处理.md

主要介绍缺失值的定义、产生与处理,对缺失值做处理时的一些影响

2019-09-01

pandas 数据结构与基础功能.md

介绍pandas库的series对象和数据框的创建、转换等相关内容

2019-09-01

numpy库.md

介绍numpy库,数组的基本属性、索引切片、运算、重塑等内容

2019-09-01

异常、模块、文件读写.md

Python基础,适合小白学习使用,本人学习时整理的笔记。

2019-08-23

Python函数.md

Python基础,适合小白学习使用,本人学习时整理的笔记。

2019-08-23

流程控制语句.md

Python基础,适合小白学习使用,本人学习时整理的笔记。

2019-08-23

基础数据类型.md

Python基础,适合小白学习使用,学习中整理出来的笔记。

2019-08-23

逻辑回归.md

结合损失函数中交叉熵函数,对线性回归问题过渡到逻辑回归理论推导

2019-08-17

用PBD制作餐饮店KPI分析仪.docx

入门篇,基于某餐饮连锁店,用PBD制作餐饮店KPI分析仪。

2019-07-27

博客文档.docx

PBD入门级使用教程,这篇博客以某餐饮连锁店为案例,制作店面分析仪。

2019-07-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除