自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 python数据分析之pandas(1)

python数据分析之pandas(1)前言最近在学习关于数据分析和数据挖掘相关的东西,来记录一下自己的学习过程,和大家一起分享。希望能够和大家一起讨论,学习更多。工具我用的是anaconda的jupyter notebook,学习资料大部分来自Github。开始学习pandas库,最先接触到的就是读取数据啦,我们pandas可以读取纯文本文件(csv文件, txt文件),还可以读取xlsx的excel文件,当然还可以读取MySQL数据表。ps:现在连接MySQL数据库的方法主要有MySQLd

2020-10-28 15:17:37 349 1

原创 python之数据分析Pandas(7)

python之数据分析Pandas(7)前言昨天因为有点事情,所以没有来得及分享,今天我们继续学习,今天学习到的是Pandas的数据排序,包括Series的排序和DataFrame的排序。开始Series的排序和往常一样,我们读取完数据之后,就开始了我们的数据分析,今天学习使用到的是天气的数据。排序对于大家来说,应该一点都不陌生,今天我们对Series排序用到的就是sort_values()Series.sort_values(ascending=True, inplace=False)

2020-07-17 15:17:33 175

原创 pythoh之数据分析pandas(6)

python之数据分析Pandas(6)前言今天我们来学习一下pandas中对缺失值的处理,包括isnull、notnull、dropna、fillna等等。开始isnull 和 notnull我们使用read_excel来读取表格并且对其进行一些操作。studf = pd.read_excel("./datas/student_excel/student_excel.xlsx", skiprows=2)studf# 读取出来的数据Unnamed: 0 姓名 科目 分数0 NaN 小

2020-07-15 17:12:14 252 1

原创 python之数据分析pandas(5)

python之数据分析pandas(5)前言数据分析主要还是通过一些数学方法统计结合可视化来进行的,今天我们学习一下pandas的数据统计函数,来进行进一步的数据分析。主要有汇总类统计、唯一去重和按值计数、相关系数和协方差。开始我们还是用的上次的天气的数据,读取数据之后,把温度的“℃”单位去掉,把温度的类型转换为‘int32’类型,和以前的步骤一样。然后开始我们的统计学习。汇总类统计汇总统计的函数有describe()函数,将数据分析之后,输出它们的有效数据行(count)、平均数(mean)、

2020-07-14 18:14:58 403

原创 python之数据分析pandas(4)

python之数据分析pandas(4)前言之前学习了如何查询读取数据、查询数据、存储数据,那我们可以增加数据嘛,答案是肯定的,那pandas怎么增添数据呢?开始在进行数据分析时,经常需要按照一定条件创建新的数据列,然后进行进一步分析。pandas提供了几种方法。有直接赋值、apply方法、assign方法。现在就来学一学它们是怎么使用的。同样我们先读取数据,和之前的一样,然后把温度的单位去掉并转换为‘int32’类型。# 读取数据并将℃替换。fpath = "./datas/beijing_t

2020-07-13 17:44:49 446

原创 python数据分析之pandas(3)

python数据分析之pandas(3)前言今天来说说pandas的一些数据结构,主要是一些查询方法,包括loc、iloc、where、query等方法,本人最喜欢的查询方式是iloc,它是根据索引来进行的查询。但是loc既能查询,也能够覆盖写入,也是一个很棒的方法,而它主要是根据标签来查询的。开始...

2020-07-12 17:59:19 634 1

原创 python数据分析之pandas(2)

python数据分析之pandas(2)前言上次写到了pandas的数据读取功能,开启了我们的数据分析之路,今天学习一些pandas的数据结构,Dataframe,Series等。开始SeriesSeries是一种类似于一维数组的对象,它由一组数据(不同数据类型)以及一组与之相关的数据标签(即索引)组成。通过一些例子展示一下他的用法。s1 = pd.Series([1,'a',5.2,7]) #创建一个变量并且进行赋值0 11 a2 5.23 7#

2020-07-11 14:53:33 479 1

ant-learn-pandas-master.zip

如果有想学python的数据分析,可以看一下这个pandas的资料,从公众号中整理过来。感兴趣的朋友们可以下载看一下,希望多多支持,共同努力,共同进步啊。

2020-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除