pandas
文章平均质量分 93
餐霞散人
这个作者很懒,什么都没留下…
展开
-
Matplotlib-利用pandas进行数据分析并作可视化展示
一、简单的绘图展示二、绘制柱状图三、共用坐标轴绘制两种不同类型的图四、pandas导入excel数据并绘制频率分布直方图五、绘制箱线图一、简单的绘图展示randomList = np.random.randn(10).cumsum()randomList#结果''' array([ 0.43692622, -0.17404988, 0.847985...原创 2018-07-31 22:12:05 · 4696 阅读 · 0 评论 -
Pandas - 数据的聚合与分组计算
1 数据分组 - groupby()1.1 按照多列进行分组的两种方法1.2 对分组进行迭代1.3 将列数据按照数据类型进行分组1.4 通过字典或者Series对DataFrame数据进行分组2 数据聚合2.1 分组结果的内置聚合函数2.2 自定义聚合函数2.3 apply函数自定义函数利用apply应用到分组对象上2.4 分组加权平均数和相关系数...原创 2018-08-08 17:07:56 · 11626 阅读 · 0 评论 -
Pandas - 数据的加载、存储与解析
Pandas加载数据Pandas存储数据Pandas加载数据import pandas as pdfrom pandas import DataFrame,Seriesimport sysread_csv 从文件,URl,文件型对象中加载带分隔符的数据,默认分隔符为逗号(,)read_table 从文件,URl,文件型对象中加载带分隔符的数据,默认分隔符为...原创 2018-08-08 16:00:23 · 1658 阅读 · 0 评论 -
Pandas-基本数据结构-Series & DataFrame
1. Series1.1 Series的创建1.2 Series的索引切片2. DataFrame2.1 DataFrame的创建2.2 DataFrame的索引,切片3 Series中的数据运算import pandas as pdfrom pandas import Series,DataFrameimport numpy as np...原创 2018-08-07 22:26:15 · 796 阅读 · 1 评论 -
Pandas - 数据规整化
1 数据规整化-合并数据集1.1 merge的内连,外连,左连,右连merge方法总结1.2 Series的数据连接1.2.1 concat()1.2.2 合并重叠数据 combine_first & append2 数据规整化-重塑与轴向选择2.1 层次化索引2.2 重塑层次化索引3 数据规整化-数据转换3.1 清除重复数据3.1.1 dupli...原创 2018-08-07 20:54:29 · 663 阅读 · 0 评论 -
Pandas-进阶应用
1 pandas中的数据运算与算术对齐2 iloc与loc的切片与索引3 DataFrame与Series之间的运算4 函数应用和映射4.1 用apply将一个规则应用到DataFrame的行或者列上4.2 applymap 将一个规则应用到DataFrame中的每一个元素5 Series和DataFrame的排序6 处理Series的重复索引7 汇总计算描述统计8...原创 2018-08-07 09:36:33 · 767 阅读 · 1 评论 -
时间模块-Python & Pandas
Python中的时间模块1 time模块1.1 时间戳1.2 结构化时间 time.struct_time1.2 格式化字符串1.3 时间函数1.4 总结:三种格式时间转化图2 datetime模块2.1时间日期对象转字符串2.2 将字符串转datetime类型Pandas中得时间日期转化1 将时间日期类型作为Series得index索引dateutil包里...原创 2018-08-06 20:50:51 · 592 阅读 · 0 评论 -
合作项目 : 人工智能专业相关职位数据分析 (爬虫+数据处理)
1 项目背景2 Scrapy 爬取51job具体信息3 数据清洗3.1 导入csv3.2 处理tags,提取其中有效信息3.2.1 处理tags中数据数目不一致,规整数据信息3.2.2 处理地区信息,提取其中省名3.3 将处理好的tags信息与原数据合并并删除原tags列3.4 处理薪资单位不一致问题,规整为 “/月”3.5 将处理完的数据保存至csv...原创 2018-08-16 18:39:24 · 1627 阅读 · 0 评论