- 博客(6)
- 资源 (1)
- 收藏
- 关注
转载 C++中string类的常用函数
a) =,assign() //赋以新值b) swap() //交换两个字符串的内容c) +=,append(),push_back() //在尾部添加字符d) insert() //插入字符e) erase() //删除字符f) clear() //删除全部字符g) replace() //替换字符h) + //串联字符串i) ==,!=,,>=,
2014-08-06 15:48:06 577
原创 Python获取网页状态码
在网页爬取的时候,有时候需要判断下要爬取网页的网页HTTP状态码,然后再进行相关的工作。1.网页HTTP状态码 HTTP状态码表示HTTP协议所返回的响应状态。具体参考:http://baike.baidu.com/view/1790469.htm?fr=aladdin HTTP状态码有5种,所有状态码的第一个数字代表了响应的5种状态之一:(1)1XX;(2)2
2014-08-05 09:41:40 20001
转载 学习编程之前你应该了解的5件事
1.组织性我希望我已经意思到了应该有一个有组织性的学习编程的方法,并且知道学习编程并不是孤立的去学,而是要在技术上构建技术。我不应该在学习web的基础技术——HTML/CSS之前就去学习更复杂的语言,比如Python.你应该知道像Codeacademy这样的网站,它以一种结构性、富有乐趣的方式来组织编程学习。你应该知道Bentobox这类东西来为你提供一个有组织的编程学习计划。
2014-08-05 08:29:44 1151
转载 当爬虫被拒绝时(Access Denied)
由于要准备测试数据,不得不大量爬取某个网站的内容。为了防止被封,特意将爬虫设计为单线程同步的爬虫。结果在爬了大约3万个页面的时候,对方发回Access Denied。等一段时间后再启动爬虫,结果还是Access Denied。这时才明白这样的想法太天真了,当初就应该找其它方法来避免才对。而本文则记述了这些其它方法。
2014-08-03 10:45:39 2618
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人