自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

原创 matplotlib扩展篇—pyecharts绘图

一.pyecharts介绍.简介 pyecharts 是一个用于生成 Echarts 图表的类库。Echarts是百度开源的一个数据可视化 JS 库。 用 Echarts 生成的图可视化效果非常棒,pyecharts 是为了与 Python 进行对接,方便在 Python 中直接使用数据生成图。.官网 官网:http://pyecharts.org GitHu...

2018-06-28 23:15:56 5038

原创 matplotlib—三种方法加载数据文件进行可视化

1.csv获取数据(1)导入模块from matplotlib import pyplot as pltimport numpy as npimport csv#用来正常显示中文标签 plt.rcParams['font.sans-serif']=['SimHei'] #用来正常显示负号 plt.rcParams['axes.unicode_minus']=False...

2018-06-28 21:38:08 8896

原创 pandas+matplotlib绘图

1.用Series进行绘图用series的行索引作为x轴,值作为数据 from matplotlib import pyplot as pltimport numpy as npfrom pandas import DataFrame,Seriesimport pandas as pd#用来正常显示中文标签 plt.rcParams['font.sans-serif']=[...

2018-06-28 10:22:52 3035

原创 pandas高级篇—apply

1.applyapply会将待处理的对象拆分成多个片段,然后对各片段调用传入的函数,最后尝试将各片段组合到一起2.head()(1)默认查找前五条数据,head(n)查找前n条数据 (2)定义函数,(函数名为top)查找前n条数据 (3)apply()——–>分别求出抽烟和不抽烟的客户中消费占比排在前五的客户 (4)如果传给apply的函数能够接受其他参数或...

2018-06-27 13:27:40 11973

原创 matplotlib—高级篇

一.深入了解柱状图1.创建一个画板plt.figure(1)2.为画板划分出多个Axesax1=plt.subplot(111) #plt.subplot(222)表示将画板分成2行2列,即四块,然后取第一块3.数据准备data=np.array([15,20,18,25]) #y轴数据width=0.5 #柱状图的宽...

2018-06-26 19:02:25 1115

原创 matplotlib—画正弦、余弦函数图

一.导入模块import matplotlib.pyplot as pltimport numpy as npplt.rcParams['font.sans-serif']=['SimHei'] # 用于正常显示中文标签plt.rcParams['axes.unicode_minus']=False # 用来正常显示负号二.创建数据1.从-pi到pi平均取256个点...

2018-06-26 18:19:56 22374 5

原创 matplotlib—创建画板

一.导入模块import matplotlib.pyplot as plt# 用于正常显示中文标签plt.rcParams['font.sans-serif']=['SimHei']# 用来正常显示负号plt.rcParams['axes.unicode_minus']=False二.创建画板步骤如果只画一个图表,不需要第一步,即不需要plt.figure(figsize=...

2018-06-26 17:33:41 3228

原创 pandas高级篇—数据的聚合与分组计算

1.对数据进行分组,groupby() (1)指定分组列 (2)size(),count(),count获取更详细 (3)对数据进行迭代输出 for….in循环输出分组后的结果 (4)将groupby分类结果转化成字典 (5)按照列的数据类型进行分组df.groupby(df.dtypes,axis=1),默认(axis=0)是按行 (6)选择分类数据中的一个...

2018-06-26 14:03:44 7052

原创 matplotlib—画图

一.画图方法1.导入模块import matplotlib.pyplot as plt # from matplotlib import pyplot as pltplt.rcParams['font.sans-serif']=['SimHei']# 用于正常显示中文标签plt.rcParams['axes.unicode_minus']=False # 用来...

2018-06-26 12:41:32 399

原创 pandas高级篇

1.pandas数据分割,cut()cut:是将数据划分成几个区间,每个区间长度一样,区间数据个数不一定一样 qcut:划分区间只能是0—1之间数,差值是分位数,包含0和1,按分位数划分,如果差值a小于1,就没有1000个值,共a*1000个数2.pandas数据过滤和筛选np.random.seed(number) number是生成随机数的种子 np.random.rand...

2018-06-25 18:29:15 1278

转载 numpy知识点汇总

一、数组方法创建数组:arange()创建一维数组;array()创建一维或多维数组,其参数是类似于数组的对象,如列表等创建数组:np.zeros((2,3)),或者np.ones((2,3)),参数是一个元组分别表示行数和列数对应元素相乘,a * b,得到一个新的矩阵数学上定义的矩阵乘法 np.dot(a, b)。如果形状不匹配会报错,但是如果a,b都是一维数组,则返回向量内积...

2018-06-25 17:07:06 370

原创 Pandas高级篇——数据处理

1.数据合并(1)数据合并取交集 (2)merge方法的各种连接:内连接,外连接,左连接,右连接,pd.merge(df1,df2,on=”key”,how=”“) (3)Series数据的连接,pd.concat(axis=”0或1”) (4)Series乘法 (5)join=”inner”,取交集。pd.concat([s1,s4],axis=1,join=”inn...

2018-06-23 15:51:33 968

原创 pandas快速进阶—时间日期

1.时间日期处理模块 parse模块 2.时间日期序列处理(1)用pandas将字符串形式的日期转换成时间序列pd.to_datetime() (2)判断pandas时间日期序列中的值是否为NaT,pd.isnull() (3)pd.date_range(,periods)方法创建一组时间日期序列,pd.date_index()的开始和结束日期创建时间日期序...

2018-06-23 13:41:54 5758

原创 Pandas进阶

1.索引获取数据2.删除操作3.value_counts与apply结合(1)统计每一列数据中,每个值出现的次数 (2)fillna(0)将NaN值转为0 (3)花式索引与获取 4.数据运算(1)加法——————–>不同索引相加为NaN (2)处理DataFrame相加之后NaN值,将得到的结果NaN填充为0 乘法 (3)D...

2018-06-22 18:37:39 337

原创 Pandas基础篇

1.构建Series 2.DataFrame(1)构建DataFrame 方法一: 方法二: 方法三: (2)简单获取DataFrame索引,添加注释,获取值

2018-06-22 17:45:43 256

原创 统计方法概括总结

总结

2018-06-15 10:23:32 303

原创 支持向量机

介绍目标找出一个超平面,使得两个类别中,与超平面距离最近的点,与超平面的距离越大越好。支持向量和间隔边界例题

2018-06-15 10:21:52 173

转载 数据挖掘的任务

数据挖掘的任务可以分为:分类、聚类、关联、回归、预测、序列分析等,具体的介绍如下: 一、分类: 分类是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。它可以应用到客户的分类、客户的属性和特征分析、客户满意度分析、客户的购买趋势预测等,如一个汽车零售商将客户按照对汽车的喜好划分成不同的类,这样营销人员就可以将新型汽...

2018-06-14 17:54:23 8473

原创 机器学习算法知识点

决策树。 **决策树是目前数据挖掘和机器学习中最流行的分类算法之一。本教程可以用作数据挖掘的风格和术语的独立介绍,而无需查看许多统计或概率先决条件。如果你是数据挖掘的新手,你会喜欢它,但是你的眉毛将会变得简单!在定义分类工作之后,我们解释信息增益(下一个Andrew教程)如何用于查找预测输入属性。我们展示了递归地应用这个过程如何构建决策树来预测未来事件。然后,我们仔细研究一个如此重要的问题,它是...

2018-06-13 10:16:30 991

转载 小知识点

介绍 size()函数size()函数主要是用来统计矩阵元素个数,或矩阵某一维上的元素个数的函数。参数 numpy.size(a, axis=None) a:输入的矩阵 axis:int型的可选参数,指定返回哪一维的元素个数。当没有指定时,返回整个矩阵的元素个数。例子 a = np.array([[1,2,3],[4,5,6]]) ...

2018-06-02 01:09:50 164

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除