- 博客(5)
- 收藏
- 关注
原创 Pandas-Task03-分组
Pandas-Task03-分组一、SACSAC指的是分组操作中的split-apply-combine过程;其中split指基于某一些规则,将数据拆分成若干组,apply是指对每一组独立地使用函数,combine指将每一组的结果组合成某一类数据结构。在改过程中,往往会遇到四类问题:整合(Aggregation) —— 即分组计算统计量(如求均值、求每组元素个数)变换(Transfor...
2020-04-27 08:21:05
137
原创 爬虫-Task02
爬虫Task02实战:中国大学排名定向爬取# 导入库import requestsfrom bs4 import BeautifulSoupimport bs4#获取页面内容def getHTMLText(url): try: r = requests.get(url, timeout=30) r.raise_for_status() ...
2020-04-23 21:42:03
203
原创 Pandas-第二章-索引
Pandas-第二章-索引一、单级索引1.loc方法、iloc方法、[]操作符(a)loc方法,标签索引(b)iloc方法,位置索引(c)[]方法2.布尔索引(a)布尔符号:’&’, ‘|’, ‘~’,即and,or,not(b)isin方法3.快速标量索引4.区间索引(a)interval_range方法(b)利用cut将数值列转为区间元素的分类变量,例如统计数学...
2020-04-23 21:24:45
369
原创 爬虫-Task01
爬虫-Task01:request.get进阶:爬取豆瓣电影以完成爬取豆瓣电影为例,进行本次学习任务的总结。目标是爬取豆瓣电影TOP250的影片名称和海报。https://movie.douban.com/top250首先对网页内容进行分析。总共250部电影,每页25部,共有10页。因此,除了爬取每页的所需内容,还需要进行跳页操作。这里先手动进行翻页,通过观察发现网址发生了变化。简...
2020-04-21 21:34:54
168
原创 Pandas学习——基础——文件读取与写入、基本数据结构、常用基本函数、排序、总结练习
Pandas学习——基础——文件读取与写入、基本数据结构、常用基本函数、排序、总结练习第一章 Pandas基础一、文件读取与写入1.读取2.写入二、基本数据结构1.Series2.DataFrame三、常用基本函数1.head和tail2.unique和nunique3.count和value_counts4.describe和info5.idxmax和nlargest6.clip和replace...
2020-04-20 23:13:39
323
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人