python 数据分析
python 数据分析
小驰驰呕吼**
热爱计算机的小可爱一枚
展开
-
7.Python数据分析之Matplotlib-2
双轴图首先还是各种准备工作:import warningswarnings.filterwarnings('ignore')import numpy as npimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=Falseimport matplotlib.mlab as mlabfr原创 2020-08-30 22:02:10 · 575 阅读 · 0 评论 -
6.Matplotlib-1习题1
(1)画出y=x^{2}+2x+1在区间[-5,3]的函数图像。(2)在同一张图中创建两个子图,分别画出sinx和cosx在[-3.14,3.14]上的函数图像。设置线条宽度为2.5.(3)读取上次作业保存的酒店数据,画出每个地区酒店数量的柱状图,柱状颜色为红色df = pd.read_excel(r"C:\Users\Adminisrator\Desktop\酒店数据2.xlsx")import warningswarnings.filterwarnings('ignore')plt.rc原创 2020-08-30 13:30:45 · 2111 阅读 · 0 评论 -
6.Python数据分析之Matplotlib-1
Matplotlib基础matplotlib是一个Python的2D图形包。pyplot封装了很多画图的函数导入相关的包:matplotlib.pyplot包含了一系列类似MATLAB中绘图函数的相关函数。每个matplotlib.pyplot中的函数对当前的图像进行一些修改。例如:产生新的图像,在图像中产生新的绘图区域,在绘图区域中画线,给绘图加上标记,等等…matplotlib.pyplot会自动记住当前的图像和绘图区域,因此这些函数会直接作用在当前的图像上。在实际的使用过程中,常常以plt作为原创 2020-08-27 22:29:53 · 943 阅读 · 0 评论 -
5.Pandas习题3
(1)读取数据。读取之前作业保存的“酒店数据1.xlsx”(2)将“类型”和“名字”设置为层次化索引,并交换索引的位置。然后将层次化索引取消。(3)将数据集转置,获取转制后的index和columns。(4)用Groupby方法来计算每个地区的评分人数的总和以及均值。(5)用Grouby方法计算每个类型的平均价格,最高价和最低价。(6)数据离散化,按照价格将酒店分为3个等级,0-500为C,500-1000为B,大于1000为A,列名设置为“价格等级”。(7)获取评分均值原创 2020-08-27 15:00:46 · 2055 阅读 · 0 评论 -
5.Pandas的使用3
数据重塑和轴向转换Series 层次化索引外层索引外层切片外层加内层取具体的值Series和DataFrame的转换通过unstack方法可以将Series变成一个DataFrame转回DataFrame的层次化索引DataFrame行和列都可以进行层次化索引此时四个索引决定一个值可以设置索引名称位置调整接下来我们就可以将豆瓣电影数据变成多层次索引结构接下来,把产地和年代同时设置成索引,产地是外层索引,年代是内层索引set_index可以把列变成.原创 2020-08-26 20:54:22 · 393 阅读 · 0 评论 -
4.Pandas习题2
(1)读取上次作业保存的数据,酒店数据1.xlsx(2)查看“评分”的格式,并分别进行升序和降序排序(3)对酒店按照价格进行排名,计算“油尖旺”地区的均价。(4)对酒店数据进行描述性统计,并求所有价格的均值方差,最大最小值,中值。(5)计算评分和价格之间的的相关系数,协方差(6)按照评分降序排序,评分相同时按价格升序排序。(7)计算一下,评分小于3分的酒店数量和占比。(8)计算一下,酒店评分大于等于4分的酒店的价格均值。(9)计算出每个地区的酒店占总酒店数量的比例。原创 2020-08-26 14:43:27 · 1732 阅读 · 0 评论 -
4.Pandas的使用2
数据格式的转换(使用dtype和astype)查看数据利用格式转换查看异常数据首先想将年代那一列转换成整数但是却出现了一些问题,接下来查看错误原因可以看到有一个数据无法转换成整数。接下来查找这个异常的数据但是这样没有看出这个数据类型有什么问题,没关系我们可以查看你一下接下来修改值为整形2018再查看一下这回再次转换成功排序例:按照投票人数进行排序默认按照升序如果想降序多个值进行排序,例:先按照评分,再按照投票人数基本的统计分析1.描述性统计通过描述原创 2020-08-25 22:18:22 · 418 阅读 · 0 评论 -
3.Pandas习题1
Pandas基本操作(1)用字典数据类型创建DataFrame。(2)将创建的Dataframe的索引设置为,ABCD。并且命名为“索引”。(3)在下面新增一行。然后删除。(4)增加新的属性列,列名设置为‘port’,值均为1。(5)取出1991和1994年的数据。(6)获取前‘state’和‘year’的数据。(7)查看每一列数据的数据格式,并且将‘pop’每个数据乘2。数据操作(1)读取香港酒店数据。(2)按照数据的内容,重新设置数据的索引,重新设置列名称为’名字’,原创 2020-08-24 15:21:18 · 1991 阅读 · 0 评论 -
3.Pandas的使用1
一维Series索引赋值Pandas库的DataFrame类型DataFrame是个二维结构,首先构造一组时间序列,作为我们第一维的下标:创建一个DataFrame结构:除了传入二维数组还可以传入字典:原创 2020-08-14 19:03:58 · 572 阅读 · 0 评论 -
2.Numpy练习
(1)创建一个1到10的数组,然后逆序输出。(2)创建一个长度为20的全1数组,然后变成一个4×5的二维矩阵并转置。(3)创建一个3x3x3的随机数组。(4)从1到10中随机选取10个数,构成一个长度为10的数组,并将其排序。获取其最大值 最小值,求和,求方差。(5)从1到10中随机选取10个数,构成一个长度为10的数组,选出其中的奇数。(6)生成0到100,差为5的一个等差数列,然后将数据类型转化为整数。(7)从1到10中随机选取10个数,大于3和小于8的取负数。原创 2020-08-14 14:36:05 · 2929 阅读 · 2 评论 -
1.python第三方库Numpy的使用
概念Numpy是python的一种开源的数值计算扩展。这种工具可以用来存储和处理大型矩阵,比python自身的嵌套列表结构要高效的多。Numpy提供了许多高级的数值编程工具。Numpy的一个重要特性是他的数组计算,是我们做数据分析必不可少的一个包。导入: import numpyimport numpy as np //给该库一个简称(约定俗成)from numpy import * //使用函数时不需要加入包名产生数组从列表产生数组:l = [0,1,2,3]a = np.array(原创 2020-08-11 16:08:29 · 1498 阅读 · 1 评论