- 博客(5)
- 资源 (1)
- 收藏
- 关注
原创 python爬虫实践之模拟登录
有些网站设置了权限,只有在登录了之后才能爬取网站的内容,如何模拟登录,目前的方法主要是利用浏览器cookie模拟登录。浏览器访问服务器的过程在用户访问网页时,不论是通过URL输入域名或IP,还是点击链接,浏览器向WEB服务器发出了一个HTTP请求(Http Request),WEB服务器接收到客户端浏览器的请求之后,响应客户端的请求,发回相应的响应信息(Http Response)
2014-01-24 10:04:19 32365 4
转载 2013流行Python项目汇总
原文: Pycoder Weekly / 编译: 蟒周刊Python作为程序员的宠儿,越来越得到人们的关注,使用Python进行应用程序开发的越来也多。那么,在2013年有哪些流行的Python项目呢?下面,我们一起来看下。一、测试和调试python_koans :Python Koans 算 “Ruby Koans” 的一部分,作为交互式教程,可以学习
2014-01-24 10:20:42 2733
原创 爬虫开发实践之前端知识
1.前端知识开发爬虫需要了解一些前端知识和基本原理,分析网页的构成元素,WEB前端的三要素:HTML + CSS + JavaScript,它们构成一MVC框架,即23个设计模式中的Model_View_Controller模式,HTML作为信息模型(Model),CSS控制样式(View),JavaScript负责调度数据和实现某种展现逻辑(Controller),很好的实现了业务逻辑和用户
2014-01-13 23:51:34 5374 1
原创 python爬虫实践之网页抓取
python自带了urllib和urllib2模块,以及第三方的requests库来抓取网页,这里我们使用easy_install包管理工具下载requests库,BeautifulSoup库,在CMD命令行下,切换到easy_install的目录,运行命令easy_install 包名称。easy_install requests安装好requests包之后,我们就可以选择使用urlli
2014-01-12 00:04:32 4928 1
原创 python之字符编码解码
用VS做C++开发的人,肯定遇到过将工程的字符集在Multibyte与Unicode之间互相转换的经历,CString,char*的转换也是家常便饭,L,_T这些宏的使用,MultiByteToWideChar()和WideCharToMultiByte(),W2A()和A2W(),虽然用起来很丑陋,但是都可以解决问题。前段时间使用python写一些脚本的时候,总是遇到UnicodeEncodeE
2014-01-08 23:21:29 3730 1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人