- 博客(6)
- 收藏
- 关注
转载 python学习笔记
内容转自:Python2爬虫学习系列教程python语法python中try/except/else/finally语句的完整格式如下所示:try:执行except A:若try出现异常,且异常类型为A,执行except B:若try出现异常,且异常类型为B,执行except:若try出现异常,且异常类型不为A或B,执行else:若try没出现异常,执行finally...
2018-10-10 15:46:00 608
原创 正则表达式初级
匹配字符串 公式 含义 \d 0-9 \w 0-9与a-z与A-Z \s 空格与tab . 任意字符 ^ 行首(以…开头) $ 行尾(以…结尾) * 任意个字符(包括0) + 至少一个字符 ? 0个或1个字符 {n} n个字符 {n,m} [n,m]...
2018-08-30 20:43:10 127
原创 写爬虫之前应该知道的
Python 爬虫架构主要由五个部分组成,分别是调度器、URL管理器、网页下载器、网页解析器、应用程序(爬取的有价值数据)。调度器:相当于一台电脑的CPU,主要负责调度URL管理器、下载器、解析器之间的协调工作。URL管理器:包括待爬取的URL地址和已爬取的URL地址,防止重复抓取URL和循环抓取URL,实现URL管理器主要用三种方式,通过内存、数据库、缓存数据库来实现。网页下载器:...
2018-08-30 16:06:29 324
原创 关于CSDN存在大量广告影响用户体验的应对措施
来到csdn的第一件事,解决广告。 今天一上来,发现页面两侧以及下方布满了广告,严重影响正常阅读。广告是根据用户平时百度的搜索词来推荐的,是否涉及侵犯隐私我还不太清楚。看了下html,图片来源全是crop.baidu.com,所以只需要屏蔽这个来源就行。 装一个adblock plus插件,其中有一个自定义过滤规则选项,输入crop.baidu.com*即可。 只需要刷新一下...
2018-08-30 11:57:02 855 1
原创 markdown学习
工欲善其事必先利其器,熟悉markdown是很有必要的markdown常见功能【1】加粗 方法:在需要加粗的文字前后各加2个* 效果: text 快捷键:ctrl+B【2】变斜 方法:在需要加粗的文字前后各加1个* 效果: text 快捷键:ctrl+I【3】插入链接 方法:[链接名] (链接的url “提示”)...
2018-08-29 19:00:36 123
原创 初来乍到
刚毕业,在一家互联网公司工作,想利用空闲时间学习一些新的东西,目前暂时把博客放在CSDN。平时写一下学习过程中学到的一些技巧以及经验,做一个备忘。...
2018-08-28 18:57:03 245
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人