数据分析
Anneaisun1995
这个作者很懒,什么都没留下…
展开
-
python利用pandas获取每行数据的最大值,最小值以及对应的columns
1.先读取文件df = pd.read_csv(path)文件部分内容如下:2.找的每一行的最小值,以及对应的列索引,并在后面增加两列df['max_idx'] = df.idxmax(axis=1) #求一行的最大值对应的索引df['max_val']= df.max(axis=1) #取出该最大值3.找的每一行的最小值,以及对应的列索引,并在后面增加两列(这里需要注意的是,...原创 2019-12-21 00:20:37 · 37734 阅读 · 3 评论 -
pandas中loc和iloc用法
loc函数:通过行索引 “Index” 或者"columns"中的具体值来取行、列数据iloc函数:通过行号或者列号来取行、列数据(如取第二行的数据、取第0列的数据)首先我们创建一个Data Frameimport numpy as npimport pandas as pd#创建一个Dataframedata=pd.DataFrame(np.arange(16).reshape(4,...原创 2019-12-19 14:07:08 · 578 阅读 · 0 评论 -
python 查看,删除 重复的值
dataFrame数据如下import pandas as pddata = pd.DataFrame({'name':['小红','小兰','小明','小芳'], 'sex':["女","女","男","女"], 'age':[19,20,23,20]}) name sex age0 小红 女 191 小兰 女 202 小明 男 233 小芳 女 201.查找age列相...原创 2019-12-19 00:57:55 · 1093 阅读 · 0 评论 -
python 将数据做出画直方图和线形图在同一个图里展示
有一个需求是画出司机常去充电站的频率分布图,通过对原始数据的处理,得到了dataframe如下license_plate B0AD42station_nameA01 0.083333C01 0.020833D06 0.020833F12 0.104167F23 0.10...原创 2019-11-06 21:10:40 · 3702 阅读 · 2 评论 -
怎样将不同Data Frame中几列数据拼成一个大dataFrame
目前在做的项目需要统计不同年份电车的充电情况,想做成箱线图,看有什么变化,充电数据是csv文件,思路是提取出每个csv文件中表示充电时间的列,拼接成一个DataFrame,再做图,遇到的问题是每个csv中充电的数据不一样多可以先用Series函数转换为Series数据,再存储到dataframe中,对应index的value值若不存在则为NaNfrom pandas import Series...原创 2019-10-30 20:36:08 · 1957 阅读 · 0 评论 -
如何在jupyter notebook上面上传文件夹
用jupyter做数据分析时,要读取很多csv文件,需要先将这些文件上传到jupyter工作目录,upload只能上传单个文件,怎样一次性上传所有的文件,节约时间呢?可以将这些要上传的文件打包,压缩上传之后,再解压import zipfileimport osfiles = zipfile.ZipFile('需要解压的文件路径', 'r')files.extractall('解压到的目录'...原创 2019-10-30 10:21:31 · 14906 阅读 · 2 评论