python
到你了,弟弟
WX:643440464AP
展开
-
Python绘制箱线图示例
import pandas as pdimport matplotlib.pyplot as plt # 导入图像库catering_sale = 'C:\\Users\Administrator\Desktop\Python数据分析与挖掘实战\chapter3\demo\data\catering_sale.xls' # 餐饮数据data = pd.read_excel(cateri...原创 2018-10-16 19:35:25 · 7236 阅读 · 3 评论 -
python随机种子
python随机种子seed( ) 用于指定随机数生成时所用算法开始的整数值,如果使用相同的seed( )值,则每次生成的随即数都相同,如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异而不同。随机种子只会作用到一个函数上,如np.random.seed(0)print(np.random.rand(3))print(np.random.rand(3))...原创 2018-10-10 20:32:28 · 27504 阅读 · 2 评论 -
pandas数据处理--多表多外键问题
工作中有可能会遇到两个DataFrame表中多个外键连接的情况,比如:data1为总表djh: 单据号(相同的单据号可能不是同一笔消费产生,不是唯一标识)…dtime: 消费产生的时间syjh: 收银机号data2为会员表dtime: 会员消费产生的时间…jf: 此次消费的会员积分syjh: 收银机号djh: 单据号(相同的单据号可能不是同一笔消费产生)那么可以从总表中分离...原创 2018-10-31 15:43:46 · 1160 阅读 · 0 评论 -
pandas取出重复数据
drop_duplicates为我们提供了数据去重的方法,那怎么得到哪些数据有重复呢?实现步骤:采用drop_duplicates对数据去两次重,一次将重复数据全部去除(keep=False)记为data1,另一次将重复数据保留一个(keep='first)记为data2;求data1和data2的差集即可:data2.append(data1).drop_duplicates(keep=...转载 2018-10-31 16:12:36 · 15960 阅读 · 1 评论