自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(29)
  • 收藏
  • 关注

原创 豆瓣读书练习-介绍filter高阶函数

豆瓣读书练习如上数据有问题如下:• 索引无序• 单价中包含各种各样单位所以需求如下:• 读取数据 重置索引• 将单价列取出 整数 或 浮点数 并转为可计算类型• 将评分列进行降序• 直观体现评分数据主要分布在哪个区间• 直观体现单价与评分的分布• 取出评分前100条数据 直观体现不同出版社的出书次数import pandas as pdimport numpy as npimport seaborn as snsfrom matplotlib import pyplot as p

2020-09-28 11:12:49 252

原创 FacetGrid与调色盘-Seaborn样式风格设置-调色盘设置

FacetGrid与调色盘FacetGrid结构图之前我们在绘图的时候,学了relplot、catplot、lmplot等,这些函数可以通过col、row等在一个Figure中绘制多个图。这些函数之所以有这些功能,是因为他们的底层使用了FacetGrid来组装这些图形。Axes绘图实际上seaborn的绘图函数中也有大量的直接使用Axes进行绘图的,凡是函数名中已经明确显示了这个图的类型,这种图都是使用Axes绘图的。比如sns.scatterplot、sns.lineplot、sns.barplo

2020-09-28 11:05:29 2344

原创 Seaborn绘图-绘制散点图,折线图-分类统计图

Seaborn绘图关系型绘图seaborn.relplot()这个函数功能非常强大,可以用来表示多个变量之间的关联关系。默认情况下是绘制散点图,也可以绘制线性图,具体绘制什么图形是通过kind参数来决定的。实际上以下两个函数就是relplot的特例:• 散点类型:scatterplot -> relplot(kind=“scatter”)• 线性类型:lineplot -> relplot(kind=“line”)基本使用import seaborn as snstips = s

2020-09-28 10:15:05 6560

原创 Matplotlib绘制3D图以及Seaborn介绍

Matplotlib绘制3D图3D立体图形之前,我们已经了解了如果使用 Matplotlib 中的 pyplot 模块绘制简单的 2D 图像。其实,Matplotlib 也可以绘制 3D 图像,与二维图像不同的是,绘制三维图像主要通过 mplot3d 模块实现。但是,使用 Matplotlib 绘制三维图像实际上是在二维画布上展示,所以一般绘制三维图像时,同样需要载入 pyplot 模块。from matplotlib import pyplot as pltfrom mpl_toolkits.mp

2020-09-18 18:19:31 3185

原创 pandas--实战以及使用pyecharts绘图,(面向对象)

实战9• covid_approval_toplines.csv• subject:与covid-19处理有关的(Trump)• modeldate:日期• party:政党• approve_estimate:赞成• disapprove_estimate:不赞成• covid_concern_toplines.csv• subject:concern-infected 关心感染,concern-economy 关心经济• very_estimate:非常关注• somewhat_es

2020-09-18 17:11:50 2905

原创 pandas—实战练习

实战4读取 population_data.json 数据统计以下5个国家2010年人口的占比情况。country_list = [“Afghanistan”,“Albania”,“Arab World”,“Aruba”,“Bangladesh”]import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdf = pd.read_json("population_data.json")df.info()df.h

2020-09-16 12:31:43 455 2

原创 pandas-实战

通过starbucks_store_worldwide.csv数据,获取中国每个省份的分布数量import pandas as pdimport numpy as npfrom matplotlib import pyplot as plt"""了解数据- 扣题:中国的市- 需求的数据 - Country - City- 有缺失值,是否要处理?count()获取非nan个数 """sb_df = pd.read_csv("starbucks_store_worldwid

2020-09-14 16:10:58 438 1

原创 pandas数据分组与聚合-时间序列-重采样

数据分组与聚合数据包含在Series、DataFrame数据结构中,可以根据一个或多个键分离到各个组中。分组操作之后,一个函数就可以应用到各个组中,产生新的值。如下图则是简单的分组聚合过程。df.groupby(‘key’) key为指定分组的列import pandas as pdimport numpy as npdf1 = pd.DataFrame( { "names":["菲菲","小可爱","mia","牛哥","老王","mia","狼人","药

2020-09-11 17:45:11 1354

原创 pandas-作业

练习1将 学生成绩表 与 选修成绩表 进行水平的拼接第一种方法import pandas as pdimport numpy as np# 读取学生成绩表跟选修成绩表df1 = pd.read_excel("学生成绩表.xlsx",index_col = 0)df2 = pd.read_excel("选修成绩表.xlsx",index_col = 0)# 使用堆叠方式进行拼接pd.concat((df1,df2),axis = 1)结果如下:第二种方法# 读取学生成绩表跟选

2020-09-10 14:15:32 273

原创 pandas数据规整-分层索引-数据合并

数据规整索引与分层索引索引• 查看索引:df.index• 指定索引:df.index = [,] 个数必须一致• 重置索引:df.reindex([,]) 无需个数一致• 指定某一列作为index:df.set_index(“M”,drop=False)• 返回index的唯一值:df.set_index(“M”).index.unique()• df.reset_index():将分层索引层级移动到列中import pandas as pdimport numpy as npdf

2020-09-09 21:13:26 926

原创 pandas-作业

练习1• 读取北向.csv 指定 trade_date 为 行索引• 查看数据的基本信息 有无缺失值 对其缺失值进行处理• 删除缺失值所在行• 查看数据的基本信息 查看数据是否清洗完毕• 标签为 index 这列没啥用 将该列删除• 观察数据是否有重复行• 将重复行进行删除• 将行索引 进行升序• 将处理好的数据 保存至 北向(副).csvimport pandas as pdimport numpy as np# 读取北向.csv 指定第一列为 行索引bx_df = p

2020-09-09 12:51:53 167

原创 pandas异常值-离散化-映射转换数据-重命名轴索引-计算虚拟变量

异常值脏数据也包含不符合要求的数据,那么对这块数据处理不能直接使用fillna填充。使用replace更加灵活。• df.replace(to_replace=None,value=None)• to_replace 去替换的值• value 替换的值import pandas as pdimport numpy as npdf = pd.DataFrame(np.random.randint(-1,200,size=(4,1)),index=["zs","an","gs","mia"],c

2020-09-08 11:11:06 343

原创 作业

练习1读取 catNames2.csv 文件,完成需求如下:• 找到所有的使用次数超过800的猫的名字• 获取用次数最高的名字读取 catNames2.csv 文件import pandas as pdimport numpy as np# 读取Excel表格数据c_df = pd.read_csv("catNames2.csv")c_df结果如下:找到所有的使用次数超过800的猫的名字# 找到所有的使用次数超过800的猫的名字c_df[c_df.loc[:,"Count_A

2020-09-04 15:59:17 399

原创 DataFrame算术-映射-Pandas数据清洗

DataFrame算术实际上,通过 + - * / // ** 等符号可以直接对DataFrame与DataFrame之间或者DataFrame以及Series之间进行运算。但秉承的原则就是对应索引运算,存在索引不同时,返回结果为索引对的并集。但是实际操作会发现,当存在索引不同时,返回的值自动填充NaN。DataFrame的运算import pandas as pdimport numpy as npdf1 = pd.DataFrame(np.ones((2,2)),columns=list(

2020-09-04 12:52:02 417

原创 作业

练习1通过 Pandas 创建 学生成绩表的 excel 文件 。参考数据如下(可自己构建):代码如下:import pandas as pdimport numpy as npstu_names = ["胡歌","林更新","金世佳","丑娟"]courses = ['语文', '数学', '英语', 'Python', '体育']data = np.array([[87., 74., 98., 84., np.nan],[79., 69., 61., 99., np.nan],[84.,

2020-09-03 11:50:13 344

原创 pandas--DataFrame基本操作-重置索引-loc及iloc

DataFrameDataFrame介绍DataFrame表示的是矩阵的数据表,它包含已排序的列集合,每一列可以是不同的值类型(数值,字符串,布尔值)。在DataFrame中,数据被存储为一个以上的二维块。DataFrame创建pd.DataFrame(data=None,index=None,columns=None,dtype=None,copy=False)• data:创建数组的数据,可为ndarray, dict• index:指定索引• dtype:数组数据类型• copy:是

2020-09-02 18:42:46 1850

原创 Pandas介绍与安装-pandas基础数据结构-Series索引与切片

Pandas介绍与安装Pandas是什么?Pandas是基于Numpy的一种工具,提供了高性能矩阵的运算,该工具是为了解决数据分析任务而创建的。也是贯穿整个Python数据分析非常核心的工具。Pandas安装直接在dos命令行中pip install pandas 即可。Pandas基础数据结构Series介绍Series是一种一维的数组型对象,它包含了一个值序列(values),并且包含了数据标签,称为索引(index)。Series创建pd.Series(data=None,inde

2020-08-31 10:59:57 287

原创 作业2020.8.29

以上为英国与美国Youtube数据,其每列对应的是:点击,喜欢,不喜欢,评论。练习1结合Matplotlib绘制各自的评论数量的图形,体现其评论数主要分布在哪个区间。代码如下:import numpy as npimport matplotlib.pyplot as pltimport matplotlib # 设置字体font = { 'family':'SimHei', 'weight':'bold', 'size':12}matplotlib.rc("fo.

2020-08-29 13:26:33 219

原创 Numpy基本操作-random模块-常用函数

random模块np.random为我们提供了许多获取随机数的函数。其实是python内置random模块进行的封装参考链接np.random.rand生成一个值为[0,1)之间的数组,形状由参数指定,如果没有参数,那么将返回一个随机值。示例代码如下import numpy as npnp.random.rand() # 随机生成0-1之间的数np.random.seed用于指定随机数生成时所用算法开始的整数值,如果使用相同的seed()值,则每次生成的随即数都相同,如果不设置这个值,

2020-08-28 12:47:06 883

原创 Numpy操作本地数据-代码优化-NaN与inf-如何处理nan

Numpy操作本地数据写入本地数据np.savetxt(fname)• fname 文件路径• dtype 数据类型• delimiter 分隔符• fmt=’%.18e’ 写入文件的格式,例如:%d,%.2f,%.18e• converters 对数据预处理。比如{0:func}第0列进行func函数预处理• heade

2020-08-26 14:50:56 795

原创 作业

练习1:在讲解 Matplotlib 的时候,我们使用以下代码绘制分组条形图。其中讲解到,三根柱子的位置需要同时往左或往右移动时,需要使用到列表推导式。实际上,duck不必,请使用numpy的所学来优化我们该部分代码。代码展示:import matplotlib.pyplot as pltimport numpy as npplt.rcParams['font.sans-serif'] = ['SimHei'] # 步骤一(替换sans-serif字体)plt.rcParams['axes.un

2020-08-25 12:01:58 214

原创 Numpy数组算术-广播机制-数组拼接-切片

Numpy数组算术数组之所以重要是因为它允许我们进行批量操作数据并且没有任何for循环。也被称为向量化。数组与标量的算术操作数组与标量的算术操作会把计算参数传递给数组的每一个元素。[0,1,2,3,4,5] 中每个元素 +1代码展示:import numpy as np# 法1[i+1 for i in range(6)]# 法2def add_one(x): return x+1list(map(add_one,range(6))) # map(func,itera

2020-08-24 11:42:00 530

原创 作业

练习(1) 创建 22 的数组arr1 元素自定义(2) 创建 223 的数组arr2 元素自定义(3) 查看arr2的维度以及形状(4) 将arr2转为1维(5) 将arr1进行转置(6) 生成 44 全为1的数组 arr3(7) 生成 单位矩阵(1) 创建 2*2 的数组arr1 元素自定义代码展示:import numpy as nparr1 = np.arange(4).reshape(2,2)arr1如图所示:(2) 创建 223 的数组arr2 元素自定义代码

2020-08-22 09:38:10 137

原创 Numpy基本操作-维数组对象-重塑数组-数组的拷贝

Numpy基本操作数组形状arr.ndim查看数组的维度,返回值为整数arr.shape查看数组的,返回值为元组N-维数组对象一维代码展示:import numpy as nparr = np.array(range(6))arr# 数组的维度 arr.ndim # 1维# 查看数组的形状arr.shape # (6,)--> 1.元组 (元组里只有一个元素的时候会自动添加一个逗号)二维代码展示:# 0轴代表行 1轴代表列arr1 =

2020-08-21 16:47:27 457

原创 作业

练习1:读取餐饮csv文件的数据第一种# 将餐饮.csv存储到jupyter中的files中import pandas as pd pd.read_csv("餐饮.csv",encoding="gbk")如图所示:第二种# 将餐饮.csv存储到jupyter中的files中import csvwith open("餐饮.csv","r") as f: datareader = csv.reader(f) for row in datareader:

2020-08-20 09:54:26 170

原创 文件读写操作-Numpy介绍与安装

文件读写操作文件操作文件操作介绍在实际操作中,通常采集本地数据来进行数据分析,那么就需要学习Python去对本地文档进行读取与写入等操作。比如:txt文件,json文件,csv文件,excel文件等。本地文件操作步骤• 打开文件• 操作文件• 关闭文件Python操作txt文件open(file, mode=‘r’,encoding=None) --> 打开文件• file --> 文件路径• mode --&

2020-08-20 09:07:38 477 1

原创 Matplotlib绘制图形-Axes容器-多图布局

直方图直方图介绍直方图由一系列高度不等的纵向条纹或线段表示数据分布的情况,一般用横轴表示数据范围,纵轴表示分布情况特点:绘制连续性的数据,展示一组或者多组数据的分布情况(统计)如图所示:直方图绘制直方图通过hist()函数绘制plt.hist(x, bins=None)# 绘制以x为数值,bins为组数组数 = 极差/组距练习某地区连续50年中四月份平均气温数据如下:temp_li= [6.9,4.1,6.6,5.2,6.4,7.9,8.6,3.0,4.4,6.7,7.1,4.7,9

2020-08-18 11:13:59 597

原创 第3节课Matplotlib作业

第3节课Matplotlib作业练习1为了对某一产品进行合理定价,我们对此类商品进行了试销实验,价格与需求量数据如下。利用图表分析规律。代码展示:frommatplotlibimportpyplotaspltprice=[60,80,40,30,70,90,95]sales=[100,50,120,135,65,45,40]plt.scatter(price,sales)plt.xlabel("price")plt.ylabel("sales")plt.show()如图所

2020-08-15 10:55:15 155

原创 数据分析-Jupyter,Matplotlib介绍-Matplotlib绘制图形

数据分析Jupyter介绍Jupyter Notebook是以网页的形式打开,可以在网页页面中直接编写代码和运行代码,代码的运行结果也会直接在代码块下显示的程序。如在编程过程中需要编写说明文档,可在同一个页面中直接编写,便于作及时的说明和解释。Jupyter Notebook的主要特点① 编程时具有语法高亮、缩进、tab补全的功能。② 可直接通过浏览器运行代码,同时在代码块下方展示运行结果。③ 以富媒体格式展示计算结果。富媒体格式包括:HTML,LaTeX,PNG,SVG等。④ 对代码编写说明

2020-08-15 09:53:38 2621

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除