自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 Pandas-Task03-分组

Pandas-Task03-分组一、SACSAC指的是分组操作中的split-apply-combine过程;其中split指基于某一些规则,将数据拆分成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构。在改过程中,往往会遇到四类问题:整合(Aggregation) —— 即分组计算统计量(如求均值、求每组元素个数)变换(Transfor...

2020-04-27 08:21:05 137

原创 爬虫-Task02

爬虫Task02实战:中国大学排名定向爬取# 导入库import requestsfrom bs4 import BeautifulSoupimport bs4#获取页面内容def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() ...

2020-04-23 21:42:03 203

原创 Pandas-第二章-索引

Pandas-第二章-索引一、单级索引1.loc方法、iloc方法、[]操作符(a)loc方法,标签索引(b)iloc方法,位置索引(c)[]方法2.布尔索引(a)布尔符号:’&’, ‘|’, ‘~’,即and,or,not(b)isin方法3.快速标量索引4.区间索引(a)interval_range方法(b)利用cut将数值列转为区间元素的分类变量,例如统计数学...

2020-04-23 21:24:45 369

原创 爬虫-Task01

爬虫-Task01:request.get进阶:爬取豆瓣电影以完成爬取豆瓣电影为例,进行本次学习任务的总结。目标是爬取豆瓣电影TOP250的影片名称和海报。https://movie.douban.com/top250首先对网页内容进行分析。总共250部电影,每页25部,共有10页。因此,除了爬取每页的所需内容,还需要进行跳页操作。这里先手动进行翻页,通过观察发现网址发生了变化。简...

2020-04-21 21:34:54 168

原创 Pandas学习——基础——文件读取与写入、基本数据结构、常用基本函数、排序、总结练习

Pandas学习——基础——文件读取与写入、基本数据结构、常用基本函数、排序、总结练习第一章 Pandas基础一、文件读取与写入1.读取2.写入二、基本数据结构1.Series2.DataFrame三、常用基本函数1.head和tail2.unique和nunique3.count和value_counts4.describe和info5.idxmax和nlargest6.clip和replace...

2020-04-20 23:13:39 323

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除