数据分析
数据分析小学堂
糖醋小排♚
这个作者很懒,什么都没留下…
展开
-
python数据分析7--图像处理
1.绘制双Y轴坐标系import pandas as pdfrom matplotlib import pyplot as pltfrom matplotlib import font_managermy_font = font_manager.FontProperties(fname='/data/course_data/data_analysis/STSONG.TTF',size=18)# 获取数据datas = pd.read_excel('/data/course_data/data_原创 2020-05-29 15:18:19 · 294 阅读 · 0 评论 -
python数据分析6--常见统计图
1.柱状图from matplotlib import pyplot as pltfrom matplotlib import font_managera = ['流浪地球','疯狂的外星人','飞驰人生','大黄蜂','熊出没·原始时代','新喜剧之王']b = [38.13,19.85,14.89,11.36,6.47,5.93]my_font = font_manager.FontProperties(fname='/data/course_data/data_analysis/STSON原创 2020-05-28 17:09:08 · 393 阅读 · 0 评论 -
python数据分析5--Matplotlib数据可视化
1.Matplotlib结构Matplotlib图像分成三层结构第一层:Canvas(画板)、Figure(画布,可以调节画布得大小和分辨率)、Axes(绘图区,一张画布上可以有多个绘图区,每一个绘图区都是一个独立得坐标系)第二层: 第二层是辅助显示层,主要包括axis(坐标轴)、spines(边框线)、grid(网格线)、legend(图例)、title(标题)等第三层:第三层为图像层,即通过plot、scatter等方法绘制的图像。from matplotlib import pyplot原创 2020-05-28 16:07:05 · 184 阅读 · 0 评论 -
python数据分析4--批量处理数据
1.数据的分组import pandas as pddf = pd.read_excel('/data/course_data/data_analysis/forbes_2018.xlsx')#df.group('X'),按照X进行分组group = df.groupby('gender')#group.size()可以返回每组的数量,并返回一个含有分组大小的Seriesfor gender,value in group.size().items(): # 计算每组的占比 acc原创 2020-05-27 22:50:15 · 759 阅读 · 0 评论 -
python数据分析3--数据的合并、筛选、排序
1.数据的合并inner取交集,outer取并集(1)利用contact()连接import pandas as pddict1={ 'A': ['A0', 'A1', 'A2', 'A3'], 'B': ['B0', 'B1', 'B2', 'B3'], 'C': ['C0', 'C1', 'C2', 'C3']}df1=pd.DataFrame(dict1)print(df1)dict2={ 'B': ['B0', 'B1', 'B2', 'B3'],原创 2020-05-27 20:23:24 · 1027 阅读 · 0 评论 -
python数据分析2--重复数据和空值处理
1.空值处理(1)基础知识文件的单元格中没有值时,在使用pandas读取后就会用NaN表示,也就是我们常说的空值,在NumPy模块中提供了nan的值,如果你想要创建一个空值,可以使用下方代码:from numpy import nan as NaNNaN比较特殊点就是其本身是一种float类型数据,当NaN可以参与到数据计算中,最终的结果却永远都是NaN。(2)过滤空值from numpy import nan as NaNimport pandas as pddf = pd.read_exc原创 2020-05-27 17:35:26 · 661 阅读 · 0 评论 -
python数据分析1--数据的读取与写入
一. python数据分析—数据的读取与写入1.数据写入到文件中进行永久性的保存,支持的文件格式有HTML、CSV、JSON、Excel2.csv的读写from pandas import Series,DataFrameimport pandas as pd# 使用字典创建index_list = ['001','002','003','004','005','006','007','008','009','010']name_list = ['李白','王昭君','诸葛亮','狄仁杰',转载 2020-05-27 15:58:13 · 361 阅读 · 0 评论