自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 收藏
  • 关注

原创 机器学习—分类算法(KNN、Bayes、Tree、RandomForest算法详解)

文章目录一、机器学习简述机器学习算法分类机器学习开发流程二、数据划分、转换器、估计器sklearn 内置数据集数据集进行分割转换器与预估器三、K-近邻算法(KNN)核心思想KNN 算法 API案例分析优缺点分析一、机器学习简述机器学习算法分类监督学习(预测):数据集有特征值+目标值分类(目标值离散型)——K-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络回归(目标值连续型)...

2020-04-11 12:34:45 1255 1

原创 Ensemble Learning——随机森林\极限森林\梯度提升树\GBDT

文章目录随机森林极限森林算法 API`class sklearn.ensemble.ExtraTreesClassifier(n_estimators=100, criterion='gini', max_depth=None, min_samples_split=2, min_samples_leaf=1)`随机森林极限森林算法 APIclass sklearn.ensemble.Ext...

2020-05-23 23:42:27 1429

原创 Python 实战之淘宝手机销售分析(数据清洗、可视化、数据建模、文本分析)

文章目录一、数据介绍二、数据清洗三、可视化分析淘宝在售手机价格区间统计商品现价&原价对比手机类型分布词云图绘制手机品牌词云图不同品牌手机总销量比较月销量气泡图收藏量与价格分析不同价格等级总销量饼图总销售额构成分析TOP10 手机价格等级构成各发货省不同价格等级销售情况四、数据建模五、文本分析SnowNLP 情感分析LDA 主题模型一、数据介绍链接: https://pan.baidu.com/s/1GVQ5rv3ElNDLOkaDzuD6Jw 密码:5h6g本文数据爬取了淘宝全网手机销售数据

2020-05-23 23:38:50 31662 27

原创 天池工业蒸汽量预测代码及详解

文章目录1、赛题介绍2、数据梳理3、建模过程4、总结1、赛题介绍赛题背景火力发电的基本原理是:燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。锅炉的燃烧效率的影响因素很多,包括锅炉的可调参数,如燃烧给量,一二次风,引风,返料风,给水水量;以及锅炉的工况,比如锅炉床温、床压,炉膛温度、压力,过热器的温度等。赛题描述经脱敏后的锅炉传感器采集的数据(采集频率是分钟级别),

2020-05-15 14:42:04 2826 1

原创 机器学习——非监督算法(聚类分析)

文章目录1.核心思想2.聚类算法 API3.案例分析4.优缺点分析1.核心思想1.聚类算法中有超参数 K,理解为将数据划分为几个类别,一般现实实现时,知道划分类别的个数。例 K=3 时2.随机在数据当中抽取 3个样本,当做三个类别的中心点(k1,k2,k3)3.计算其余的点分别到这三个中心店的距离,每一个样本有三个距离(a,b,c),对每一个样本从(k1,k2,k3)中间选出距...

2020-04-15 13:59:08 1433

原创 机器学习——回归算法

文章目录一、线性回归算法核心思想LR 算法 API案例分析优缺点分析岭回归Ridge算法API正则化力度案例分析二、逻辑回归算法一、线性回归算法核心思想LR 算法 API 正规方程sklearn.linear_model.LinearRegression()最小二乘法线性回归- 返回参数:coef_ 回归系数 梯度下降sklearn.linear_model.SGDReg...

2020-04-13 16:58:23 563 1

原创 机器学习—数据的特征工程

文章目录一、数据的特征工程1.字典的特征抽取①语法②流程③案例④One-hot 编码2.文本特征抽取1)Count 方法①语法②流程③案例④特殊规则⑤jieba.cut 分词处理器2)Tf/Idf方法① 语法② 流程③ 案例3.数据的特征预处理1)处理方法2)归一化① 语法② 流程③ 案例3)标准化① 语法② 流程③ 案例① 语法② 流程③ 案例二、模型、策略、优化三、分类、回归和聚类四、Tens...

2020-04-09 15:17:33 579

原创 Python-Matplotlib包的使用

文章目录一、散点图1.语法2.参数解释3.示例二、折线图1.语法2.参数解释3.示例三、条形图1.语法2.参数解释3.示例四、直方图1.语法2.参数说明3.示例五、饼状图1.语法2.参数解释3.示例六、箱型图1.语法2.参数解释3.示例七、颜色和样式1.颜色①八种内键默认颜色缩写②其他颜色表示方法2.点、线的样式①点形状②四种线型3.样式字符串八、子图1.语法2.示例九、多图十、网格十一、图例方法...

2020-04-01 16:50:31 876

原创 Pandas进阶

文章目录一、Pandas索引1.行索引2.列索引3.索引类4.重复索引5.多层索引1)创建2)索引交换3)按照索引层次进行统计4)索引与列的转换二、分组计算1.对 Series 分组2.对 DataFrame 分组3.分组中的元素个数统计4.对分组进行迭代5.分组转化为字典6.按列分组7.通过字典进行分组8.通过函数分组9.通过索引级别进行分组三、聚合运算1.数据聚合1)内置聚合函数2)自定义聚合...

2020-03-31 17:27:45 180

原创 Pandas 快捷入门

Pandas 快捷入门1、 Pandas创建序列dates = pd.date_range('20200301',periods=6)df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=list('ABCD'))df# 使用字典来创建:key 为 DataFrame 的列;value 为对应列下的值df1 = pd....

2020-03-27 18:29:11 373

原创 基于RFM 模型的 Python 实战分析

基于RFM 模型的 Python 实战分析一、RFM 模型介绍RFM模型是根据客户活跃程度和交易金额的贡献,进行客户价值细分的一种用户分类方法。R(Recency)——最近一次交易时间间隔。基于最近一次交易日期计算的得分,距离当前日期越近,得分越高。如5分制反映客户交易活跃度较高。F(Frequency)——客户在最近一段时间内交易次数。基于交易频率计算的得分,交易频率越高,得分越高。如...

2020-03-26 22:33:50 2007 1

原创 Python 基础

Python 基础介绍一、基础语法介绍1.Python 基本格式2.图形化程序设计3.变量的声明与赋值4.常量5.基本内置数据类型介绍6.基本运算7.类型转换和四舍五入8.增强型赋值运算符9.布尔值10.提取字符串[]11.replace()实现字符串替换12.字符串切片操作13.split()分割和 join()合并操作13.常用查找方法14.去除首尾信息15.大小写转换(a=i love yo...

2020-03-26 20:05:46 317

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除