- 博客(4)
- 收藏
- 关注
原创 配合scrapy,用请求方式抓取一些网站内容。例如抓取360手机应用APP信息。
并不是一想到抓取网页就开始写scrapy爬虫,其实根据需求选择适当的方式来抓取反而效率更高。例如抓取360手机应用各种分类的前5页的信息。我们不写scrapy,而直接去分析请求消息的样式,模拟发送这个消息,然后分析返回的内容,同样可以获取想要的信息。更重要的是,在对于一些JS动态加载内容(例如抓取Googleplay上的应用)抓取时,这种方式去获取重要信息后再配合scrapy抓取,就能获得更好
2015-08-28 22:33:38 1470
原创 python 字符串组成MySql 命令时,字符串含有单引号或者双引号导致出错解决办法
python 字符串组成MySql 命令时,字符串含有单引号或者双引号导致出错解决办法
2015-08-27 22:22:37 10956 1
转载 一小时入门正则表达式
本文目标30分钟内让你明白正则表达式是什么,并对它有一些基本的了解,让你可以在自己的程序或网页里使用它。如何使用本教程最重要的是——请给我30分钟,如果你没有使用正则表达式的经验,请不要试图在30秒内入门——除非你是超人 :)别被下面那些复杂的表达式吓倒,只要跟着我一步一步来,你会发现正则表达式其实并没有想像中的那么困难。当然,如果你看完了这篇教程之后,发现自己明白了很多,却又几乎
2015-08-06 18:03:51 960
原创 新手,Visual Studio 2013 配置Boost库。 如何编译和选择,遇到无法打开文件“libboost_thread-vc120-mt-gd-1_58.lib的解决办法
VS2013 配置Boost
2015-08-06 16:08:45 14919 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人