自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据分析师

数据分析师

  • 博客(71)
  • 收藏
  • 关注

原创 知了业务逻辑梳理

https://www.processon.com/view/link/618b92fe5653bb36b393a6cf

2021-11-17 23:19:00 22

原创 mysql其他常用操作技巧

# 导包import numpy as npimport pandas as pdimport pymysql # 创建连接对象mydb = pymysql.connect( host='localhost', # 数据库服务器所在ip地址,如果是本机,就使用loacalhost, 或者127.0.0.1 ...

2021-08-21 20:36:00 48

原创 1 在本机上创建单机版pyspark

1安装javapyspark需要java支持,首先必须安装java, 至少安装java8,或者更高版本,推荐java8安装教程:https://www.runoob.com/java/java-environment-setup.html记得配置环境变量:java_home安装成功如下:2下载spark并解压放在一个新的文件夹下spark官网:https://archi...

2021-07-25 00:11:00 24

原创 pyecharts绘图代码

https://nbviewer.jupyter.org/github/China-LuoYaxiong/pyecharts/blob/master/01.pyecharts%E7%9A%84%E5%9F%BA%E6%9C%AC%E4%BD%BF%E7%94%A8.ipynb

2020-08-16 21:46:00 26

原创 淘宝用户行为数据分析

https://nbviewer.jupyter.org/github/China-LuoYaxiong/-/blob/master/%E6%B7%98%E5%AE%9D%E7%94%A8%E6%88%B7%E8%A1%8C%E4%B8%BA%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90.ipynb

2020-08-16 19:03:00 19

原创 航空公司客户价值分析

https://nbviewer.jupyter.org/github/China-LuoYaxiong/project_ipy/blob/master/%E8%88%AA%E7%A9%BA%E5%85%AC%E5%8F%B8%E5%AE%A2%E6%88%B7%E4%BB%B7%E5%80%BC%E5%88%86%E6%9E%90.ipynb

2020-08-14 14:40:00 17

原创 强烈推荐--谁说菜鸟不会数据分析

这本书写的很好

2020-06-27 14:59:00 13

原创 将博客搬至CSDN

准备将博客搬家至CSDN

2020-04-05 23:37:00 16

原创 pandas思维的MySQL

https://nbviewer.jupyter.org/github/China-LuoYaxiong/pandas-mysql/blob/master/pandas%E6%80%9D%E7%BB%B4%E7%9A%84SQL%28%E4%B8%80%29.ipynb

2020-04-01 17:13:00 16

原创 mysql中的相关数据类型和约束

2020-03-31 11:30:00 15

原创 pandas

https://nbviewer.jupyter.org/github/China-LuoYaxiong/pandas/tree/master/

2020-02-24 10:26:00 16

原创 常用可视化代码

https://nbviewer.jupyter.org/github/China-LuoYaxiong/keshihua50/blob/master/week1%20correlation%20-%2001%E6%95%A3%E7%82%B9%E5%9B%BE%20%26%2002%E6%B0%94%E6%B3%A1%E5%9B%BE.ipynb

2020-02-23 20:37:00 18

原创 珍爱网女性用户数据分析

一、利用爬虫爬取数据二、清洗女性用户数据三、清洗女性用户的配偶要求四、可视化分析

2020-01-17 09:58:00 50

原创 拉勾网数据分析职位分析

请点击:https://nbviewer.jupyter.org/github/China-LuoYaxiong/ipynb/blob/master/%E6%8B%89%E5%8B%BE%E7%BD%91%E6%95%B0%E6%8D%AE%E5%88%86%E6%9E%90%E8%81%8C%E4%BD%8D%E5%88%86%E6%9E%90.ipynb

2020-01-14 17:08:00 31

原创 按时分秒对数据进行分箱

https://nbviewer.jupyter.org/github/China-LuoYaxiong/pandas/blob/master/%E6%97%B6%E9%97%B4%E6%8C%89%E6%97%B6%E5%88%86%E7%A7%92%E6%9D%A5%E5%88%86%E7%AE%B1.ipynb

2019-12-19 11:59:00 18

原创 numpy

链接地址:https://nbviewer.jupyter.org/github/China-LuoYaxiong/numpy/tree/master/

2019-11-16 21:49:00 15

原创 基于协同过滤的推荐系统案列

https://nbviewer.jupyter.org/github/China-LuoYaxiong/ipynb/blob/master/%E5%9F%BA%E4%BA%8E%E5%8D%8F%E5%90%8C%E8%BF%87%E6%BB%A4%E7%9A%84%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F%E6%A1%88%E4%BE%8B.ipynb

2019-11-08 00:32:00 13

原创 python基础

python课件一 基础语法https://nbviewer.jupyter.org/github/China-LuoYaxiong/python_ipynb/blob/master/python%E8%AF%BE%E4%BB%B6%E4%B8%80%E2%80%94%E2%80%94%E5%9F%BA%E7%A1%80%E8%AF%AD%E6%B3%95.ipynbpython课件...

2019-11-06 09:29:00 26

原创 集成算法之随机森林

随机森林jupyter notebook点击一下连接:https://nbviewer.jupyter.org/github/China-LuoYaxiong/ipynb/blob/master/%E9%9B%86%E6%88%90%E7%AE%97%E6%B3%95%E4%B9%8B%E9%9A%8F%E6%9C%BA%E6%A3%AE%E6%9E%97.ipynb若上面的连接打不开,就点...

2019-09-16 17:36:00 16

原创 sklearn之PCA(主成分分析)

完整的ipynb分析流程,请点击以下连接:https://nbviewer.jupyter.org/github/China-LuoYaxiong/ipynb/blob/master/Scikit%20Learn%E4%B9%8BPCA%E9%99%8D%E7%BB%B4%EF%BC%88%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90%EF%BC%8...

2019-09-14 10:38:00 17

原创 基于决策树的保险案列

完整的分析流程,请点击以下连接:https://nbviewer.jupyter.org/github/China-LuoYaxiong/ipynb/blob/master/%E5%9F%BA%E4%BA%8E%E5%86%B3%E7%AD%96%E6%A0%91%E7%9A%84%E4%BF%9D%E9%99%A9%E6%A1%88%E5%88%97.ipynb如果上面的连接打不开,就点下...

2019-09-12 21:14:00 10

原创 主成分分析(PCA)Principal Component Analysis

关于主成分分析的理论推导(PCA降维算法)一 特征选择与特征提取关于主成分分析,严格一点说,它应该属于特征提取,而不是特征选择。我们先来看看什么是特征选择?比如现在我们的训练数据集是:\[\left \{ (x_{1},y_{1}),(x_{2},y_{2}),(x_{3},y_{3}),...(x_{p},y_{p}) \right \}\]其中 :\[x_{i} = [ x_{...

2019-08-15 10:00:00 14

原创 梯度下降算法

梯度下降算法详解介绍如果说在机器学习领域有哪个优化算法最广为认知,用途最广,非梯度下降算法莫属。梯度下降算法是一种非常经典的求极小值的算法,比如在线性回归里我们可以用最小二乘法去解析最优解,但是其中会涉及到对矩阵求逆,由于多重共线性问题的存在是很让人难受的,无论进行L1正则化的Lasso回归还是L2正则化的岭回归,其实并不让人满意,因为它们的产生是为了修复此漏洞,而不是为了提升模型效果,甚至...

2019-07-25 16:06:00 15

原创 Xgboost

2019-06-01 22:40:00 11

原创 梯度提升树(Gradient Boosting Decision Tree---GBDT)

2019-06-01 17:47:00 16

原创 Adaboost

2019-05-30 18:59:00 9

原创 关于特征筛选中的IV值

1 IV的用途IV的全称是InformationValue,中文意思是信息价值,或者信息量。我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选。比如我们有200个候选自变量,通常情况下,不会直接把200个变量直接放到模型中去进行拟合训练,而是会用一些方法,从这200个自变量中挑选一些出来,放进模型,形成入模变量列表。那么我们怎么去挑选入模变量呢?挑选入模变量过程是...

2019-05-28 09:43:00 27

原创 二 k-means聚类算法的手动实现

一、python实现k-meansimport numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib.pyplot as plt%matplotlib inline#为了减少迭代次数,我们可以尽量把质心初始化在数据分布的内部def randCent(data, k): #定义随机选取质心...

2019-04-18 22:44:00 20

原创 二 统计量及其抽样分布

一 统计量1. 设 X1,X2,…,Xn 是 从 总 体 X 中 抽 取 的 容 量 为 n 的 一 个 样 本 , 如 果 由 此 样 本 构 造 一 个 函 数 T(X1,X2,…,Xn) , 不 依 赖 于 任 何 未 知 参 数 , 则 称 函 数 T(X1,X2,…,Xn) 是一个统计量 样本均值、样本比例、样本方差等都是统 计量2. 统计量是样本的一个函数3. 统计量...

2019-04-14 15:43:00 27

原创 决策树(Decision Trees)

2019-04-14 15:23:00 17

原创 六 EM算法

2019-04-13 21:55:00 13

原创 五 朴素贝叶斯(Naive Bayesian)

2019-04-13 18:20:00 12

原创 统计学

一 数据的概括性度量二 统计量及其抽样分布

2019-04-13 08:44:00 11

原创 一 数据的概括性度量

一 数据的概括性度量(1)集中趋势的度量 分类数据:众数1. 一组数据中出现次数最多的变量值2. 适合于数据量较多时使用3. 不受极端值的影响4. 一组数据可能没有众数或有几个众数5. 主要用于分类数据,也可用于顺序数据和数值 型数据 顺序数据:中位数和分位数中位数:1. 排序后处于中间位置上的值2. 不受极端值的影响(重要)3. 主要用于顺序数据,也可...

2019-04-12 20:47:00 117

原创 三 k-近邻算法(k-Nearest Neighbors KNN)

K近邻算法1 模型建立的基本思路 学习机器学习,永远是从分类模型开始——这是一种有监督的,最容易理解的机器学习模型。分类算法是根据样本的特征预测出样本所在的类别,因此分类算法中的标签的类别通常使用整数来表示。例如,如果只有两种类别:男女,是否,正负,则我们往往使用0表示一类,1表示一类,或者使用 [1,-1]分别表示两类。当分类的标签中含有多种类别,比如说“哺乳动物,软体动物,节肢动物”,...

2019-04-12 19:42:00 40

原创 二 逻辑回归(Logistic Rgression)

2019-04-12 17:56:00 14

原创 某区域房价中位数预测

一 获取数据#导入数据,并查看一下前五行import pandas as pddata = pd.read_csv('D:\Jupyter\handson-ml-master\datasets\housing\housing.csv')data.head()可以发现,一共有10个字段,我们再用info()方法仔细查看一下#查看字段详细信息信息data.info()我们...

2019-04-11 21:06:00 11

原创 一 线性回归(Linear Regression)

2019-04-11 15:52:00 13

原创 支持向量机(Support Vector Machine)

2019-04-10 23:58:00 12

原创 机器学习常见算法

一 线性回归链接:https://www.cnblogs.com/LUOyaXIONG/p/10690191.html二 逻辑回归链接:https://www.cnblogs.com/LUOyaXIONG/p/10697596.html三 k-近邻算法链接:https://www.cnblogs.com/LUOyaXIONG/p/10698121.html四 决策树链接:https...

2019-03-24 21:08:00 13

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除