数据可视化
数据可视化
蔚蓝祥和的天空
这个作者很懒,什么都没留下…
展开
-
数据可视化--pivot_table和crosstab
import numpy as npimport pandas as pdfrom pandas import Series,DataFramedf = DataFrame({'类别':['水果','水果','水果','蔬菜','蔬菜','肉类','肉类'], '产地':['美国','中国','中国','中国','新西兰','新西兰','美国'], '水果':['苹果','梨','草莓','番茄','黄瓜','羊肉','牛肉'],原创 2020-09-27 18:08:16 · 522 阅读 · 0 评论 -
Instacart订单分析1--数据可视化
数据可视化1. 数据说明数据共有300 0000orders,20 0000users,5000products,每个user提供有4-100个orders2. 各数据内容了解aisles:产品摆放位置说明order_products__prior:订单产品关联表orders.csv: 用户下单记录表。products.csv: 产品ID分类,及其摆放位置的关系表departments.csv: 产品分类表3. 目标分析目标是预测用户下次购买时,可能再次购买的产品。即,用户历史转载 2020-09-27 16:55:34 · 927 阅读 · 3 评论 -
数据可视化_Second_Chapter
函数积分图import numpy as npimport matplotlib.pyplot as pltimport matplotlib as mplfrom matplotlib.patches import Polygondef func(x): return -(x-2)*(x-8) + 40x = np.linspace(0,10)y = func(x)fig,ax = plt.subplots()plt.plot(x,y,"r",linewidth=2)原创 2020-08-10 00:42:07 · 111 阅读 · 0 评论 -
数据可视化_First_Chapter
1 散点图import numpy as npimport pandas as pdimport matplotlib.pyplot as plt# height=[161,170,182,175,173,165]# weight=[50,58,80,70,69,55]# plt.scatter(height,weight)# plt.show()N = 1000# x = np.random.randn(N)# y1 = np.random.randn(N)# plt.scatte原创 2020-08-05 00:53:39 · 312 阅读 · 0 评论 -
数据科学包_Twelvth_Chapter
时间日志选择重要字段处理重要字段计算开始和结束时间分组查询每项任务占用时间计算编程占用时间转化为月份时期计算Tag标签中每类任务所用时长处理一天中重复标签转化为月份数据...原创 2020-08-02 15:27:56 · 128 阅读 · 0 评论 -
数据科学包_Eleventh_Chapter
数据可视化折线图折线图子图柱状图直方图概率密度图散点图饼图原创 2020-08-02 11:01:58 · 79 阅读 · 0 评论 -
数据科学包_Tenth_Chapter
重采样ohlc按时期分组升采样升采样填充转化为时期parse_date将索引改成时间类型parse_date将索引改成时间类型原创 2020-08-01 21:38:38 · 100 阅读 · 0 评论 -
数据科学包_Ninth_Chapter
Pandas时间序列原创 2020-08-01 15:39:05 · 88 阅读 · 0 评论 -
数据科学包_Eighth_Chapter
Pandas读入和导出读入导出原创 2020-08-01 14:41:57 · 107 阅读 · 0 评论 -
数据科学包_Seventh_Chapter
Pandas 聚合计算Pandas 按照不同的列索引值进行分组聚合Pandas 按照函数分组聚合函数复合聚合修改分组索引自定义函数和自带函数聚合数据透视修改索引和合并使用transform合并按行分组apply函数应用...原创 2020-08-01 13:57:56 · 98 阅读 · 0 评论 -
数据科学包_Sixth_Chapter
Pandas 索引分组过程按照索引分组将分组转化为字典类型按照类型进行分组按照字典进行分组按照函数进行分组多级分组原创 2020-07-30 22:44:48 · 100 阅读 · 0 评论 -
数据科学包_Fifth_Chapter
Pandas原创 2020-07-28 23:03:20 · 83 阅读 · 0 评论 -
数据科学包_Fourth_Chapter
SeriesSeries创建Series索引Series中Numpy运算DataFrameDataFrame创建DataFrame插入DataFrame函数方法DataFrame重新索引DataFrame填充DataFram删除列和列运算原创 2020-07-18 11:16:42 · 120 阅读 · 0 评论 -
Pandas补充--电影数据分析
1、导入数据2、连接3、数据可视化4、评分5、分组6、求均值7、根据评分和热度筛选原创 2020-07-16 19:57:02 · 174 阅读 · 0 评论 -
数据科学包_Third_Chapter
Pandas1、双层索引2、 数据透视3、 时间索引3.1 按“s”索引3.2 按季度索引季度转化为时间日期格式4、 时间加减天数5、 按成绩排序新加类型为category的时间列按照category索引6、 累加7、 保存8、 查询保存信息9、 指定列索引...原创 2020-07-16 17:47:27 · 103 阅读 · 0 评论 -
数据科学包_Second_Chapter
Pandas1 重新索引2 填充3 是否有空值3 累加4 减去序列5 apply6 合并7 最后插入行8 分组原创 2020-07-14 22:32:14 · 114 阅读 · 0 评论 -
数据科学包_First_Chapter
numpy基础运算矩阵的生成import numpy as npa=np.array([[1,2,3],[4,5,6]])print(a)#0矩阵b=np.zeros((3,4))print(b)#1矩阵c=np.ones((3,3))print(c)#3行4列矩阵d=np.arange(12).reshape(3,4)print(d)#在指定的间隔内返回均匀间隔的数字e=np.linspace(1,10,5)print(e)#随机产生矩阵a=np.random.rand原创 2020-07-12 18:28:35 · 270 阅读 · 0 评论