- 博客(2)
- 收藏
- 关注
转载 Java爬虫学习1
第一部分:爬虫基础知识通用网络爬虫:爬取对象从一些种子 URL 扩充到整个 Web,主要为门户站点搜索引擎和大型 Web 服务提供商采集数据。聚焦网络爬虫:选择性地爬行那些与预先定义好的主题相关的页面。(如搜索引擎基于关键字搜索)增量网络爬虫:对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫。(如爬取帖子,每次只需爬取最近几天的内容;天气数据的采集;新闻数据的...
2019-11-07 17:54:54
227
原创 Python 对list的简单排序
假如a是一个由元组构成的列表,我们需要用到参数key,也就是关键词,lambda是一个隐函数,x表示列表中的一个元素,在这里,表示一个元组;x[0]表示元组里的第一个元素,当然第二个元素就是x[1];所以这句命令的意思就是按照列表中元组的第一个元素排序 sort(a,key=lambda x:(x[1],x[0]))先按照第2个元素排序,再按照第1个元素排序...
2018-04-29 14:44:22
189
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人