数据挖掘
Leon_Kbl
说到做到 笔直向前
展开
-
数据分析处理(二)
取出前十下单id及数量jupyter导包import pandas as pd #导入pandas用于表格操作import xlrd #导入xlrd用于获取一个表格里多个sheetfrom matplotlib import pyplot as plt#导入pyplot用于绘图解决中文乱码问题#sans-serif就是无衬线字体,是一种通用字体族。#常见的无衬线字体有 Trebu...原创 2019-07-31 00:05:31 · 339 阅读 · 0 评论 -
时间序列之重采样引入
数据重采样时间数据由一个频率转换到另一个频率降采样升采样生成一条带随机值的时间序列import numpy as npimport pandas as pddate_index=pd.date_range('20190701',periods=12) #periods区间data_series=pd.Series(index=date_index,data=np.arange(...原创 2019-08-02 09:11:34 · 592 阅读 · 0 评论 -
pandas子图绘制及简单案例实践
参考:matplotlib绘制多子图subplots()方法快速绘制subplots()方法快速的创建多子图环境,并返回一个包含子图的Numpy数组fig, ax = plt.subplots(2,3,sharex=‘col’, sharey=‘row’)通过sharex和sharey参数,自动地去掉了网格内部子图的坐标刻度等内容,实现共享,让图形看起来更整齐整洁。元数据简略数据...原创 2019-08-01 22:16:06 · 6318 阅读 · 0 评论 -
python时间序列分析(一)
用pandas中的rolling函数计算时间窗口数据pandas.DataFrame.rolling参数详解pandas中提供了pandas.DataFrame.rolling这个函数来实现滑动窗口值计算,下面是这个函数的原型:DataFrame.rolling(window,min_periods=None,center=False,win_type=None,on=None, axis=...原创 2019-08-01 19:54:29 · 612 阅读 · 0 评论 -
数据分析处理(一)
菜品数据分析绘图导包import numpy as npimport pandas as pd #导入pandas用于表格操作import xlrd #导入xlrd用于获取一个表格里多个sheetfrom matplotlib import pyplot as plt#导入pyplot用于绘图解决中文乱码问题#sans-serif就是无衬线字体,是一种通用字体族。#常见的无衬...原创 2019-07-31 00:05:14 · 1900 阅读 · 0 评论 -
数据分析处理(十)之囊中取物
取出前十条京东超市热评度的数据并绘图表格样本import numpy as npimport pandas as pdfrom matplotlib import pyplot as pltimport replt.rcParams[‘font.sans-serif’]=[‘SimHei’] #中文data=pd.read_excel(‘年货.xlsx’)data1=data[...原创 2019-08-05 20:21:35 · 462 阅读 · 0 评论 -
iloc与loc区别
iloc PK loc导入numpy,pandasimport numpy as npimport pandas as pd构建一个0,30左闭右开的偶数数组data=np.arange(0,30,2) #arange(起始,结束,相差)data类型ndarrayprint(type(data))<class 'numpy.ndarray'>reshape变...原创 2019-07-27 10:50:33 · 33972 阅读 · 6 评论 -
numpy中的asarray和array的区别
上课老师讲了把一个列表用array和ndarray转成矩阵,但是样式一模一样,但也没讲为什么?然后就只能靠自己无尽的网络探索元数据是列表转成ndarrayimport nuimport numpy as npdata1=[[1,1,1],[1,1,1],[1,1,1]]arr2=np.array(data1)arr3=np.asarray(data1)data1[1][1]=2pri...翻译 2019-07-31 00:08:51 · 355 阅读 · 1 评论 -
数据分析处理(八)
整个月中某天前十个菜品的数量import numpy as npimport pandas as pd #导入pandas用于表格操作import xlrd #导入xlrd用于获取一个表格里多个sheetfrom matplotlib import pyplot as plt#导入pyplot用于绘图from datetime import datetime as dt# 解决中...原创 2019-07-31 20:00:32 · 242 阅读 · 0 评论 -
pandas常用函数
参考链接:http://blog.sina.com.cn/s/blog_77f476ef0102xid5.html1 import语句2 文件读取3 数据预处理4 数据筛选5 数据运算与排序6 数学统计1 import语句import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport d...转载 2019-08-04 19:47:48 · 233 阅读 · 0 评论 -
数据分析处理(九)之口红
模拟自练数据分析 1、统计出防晒的产品保质期3年及以上且质量分高于4.55的前十数据,价格排序,绘图X轴为店名,Y轴为价格 2、绘制柱状图,X轴为各个国家,Y轴为只适合女的产品总数量。3、哪个国家的不同店名数量最高前十名 绘图X为国家,Y为国家对应的店铺数量4、以不同人群分组,得出对应分数量组下不同功效的数量,以数量降序排列,取出前五绘制饼状图。5、取出总销量前10的产品,将其质量分和服...原创 2019-08-04 10:01:12 · 4582 阅读 · 1 评论 -
数据分析处理(七)
一天什么时间下单最多import pandas as pd #导入pandas用于表格操作import xlrd #导入xlrd用于获取一个表格里多个sheetfrom matplotlib import pyplot as plt#导入pyplot用于绘图from datetime import datetime as dt# 解决中文乱码问题#sans-serif就是无衬线字...原创 2019-07-31 22:07:15 · 497 阅读 · 0 评论 -
数据分析处理(六)
每日菜品总价格import numpy as npimport pandas as pd #导入pandas用于表格操作import xlrd #导入xlrd用于获取一个表格里多个sheetfrom matplotlib import pyplot as plt#导入pyplot用于绘图from datetime import datetime as dt# 解决中文乱码问题...原创 2019-07-31 00:01:58 · 240 阅读 · 0 评论 -
数据分析处理(五)
ID点菜次数最多 import numpy as np import pandas as pd #导入pandas用于表格操作 import xlrd #导入xlrd用于获取一个表格里多个sheet from matplotlib import pyplot as plt#导入pyplot用于绘图 from datetime import datetime# 解决中文乱码问题...原创 2019-07-31 00:02:46 · 258 阅读 · 0 评论 -
数据分析处理(四)
前十个吃饭最多的时间jupyter导包from matplotlib import pyplot as pltimport pandas as pd #导入pandas用于表格操作解决中文乱码问题#sans-serif就是无衬线字体,是一种通用字体族。#常见的无衬线字体有 Trebuchet MS, Tahoma, Verdana, Arial, Helvetica, 中文的幼圆、...原创 2019-07-31 00:03:07 · 241 阅读 · 0 评论 -
数据分析处理(三)
前十个花钱最多的用户IDjupyter导包import pandas as pd #导入pandas用于表格操作import xlrd #导入xlrd用于获取一个表格里多个sheetfrom matplotlib import pyplot as plt#导入pyplot用于绘图解决中文乱码问题#sans-serif就是无衬线字体,是一种通用字体族。#常见的无衬线字体有 Tre...原创 2019-07-31 00:05:46 · 362 阅读 · 0 评论 -
数据分析(十一)之lambda函数应用三元判断
电视剧网播量数据分析解释一下Python中的三元运算[on true] if [expression] else [on false]如果表达式为True,就执行[on true]中的语句。否则,就执行[on false]中的语句a,b=2,3min=a if a<b else bmin部分数据结构图import numpy as npimport pandas as ...原创 2019-08-10 19:59:26 · 2059 阅读 · 0 评论