python
金甲虫Scarb
这个作者很懒,什么都没留下…
展开
-
python requests库 笔记
requests的一些方法requests.request参数解释method: get/post/head/put/deleteurlparams: 请求的参数(定制http的参数)data: 上传的数据:字典,字节流,类文件句柄json: 上传的json数据headers: 自定义http头cookie: 发送额外的cookies(字典),默认自动处理发送上一次的cookieve原创 2016-03-03 20:07:09 · 740 阅读 · 0 评论 -
python HTMLParser 库 笔记
官方文档HTMLParser原创 2016-03-03 23:24:16 · 887 阅读 · 0 评论 -
python BeautifulSoup 库 笔记
本文章来自: 静觅 » Python爬虫入门八之Beautiful Soup的用法 并且经过我一定的修改1. Beautiful Soup的简介简单来说,Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下: Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为原创 2016-03-03 23:17:11 · 409 阅读 · 0 评论 -
python3 爬虫 模拟登陆豆瓣修改签名
分析豆瓣的登陆界面 地址:https://accounts.douban.com/login 可以看到需要输入一个验证码抓包首先手动登陆一次自己的账号,抓包 看到Form Data和Request Headers Form Datasource:Noneredir:https://www.douban.com/form_email:jjhfen00@163.comform_passwo原创 2016-03-04 00:39:18 · 2709 阅读 · 2 评论 -
我的第一个Python3 网络爬虫 百度百科爬虫
最近学习Python 廖雪峰老师的Python 3教程 想要用项目练练手。Python网络爬虫看起来是不错的练手项目,于是着手学习爬虫的制作。 一开始并没有什么头绪,直到看到了慕课网的Python爬虫教程。 这个教程基于python2,但是给了我爬虫的基本思路。接着我用python3写了该教程上的百度百科(弱智)爬虫。百度百科(弱智)爬虫 基于python3功能简介爬取与某个百科页面相关的几原创 2016-02-20 14:19:16 · 3455 阅读 · 0 评论 -
基于python3的杭电HDU ACM AC自动机
先放几个图RunnerUp资料页起因规划和思路一开始规划成了2个模块一个答案爬取模块和一个OJ操作模块模块终于开始写代码啦1 login模块2 submit模块3 getdiscuss模块4 getsolved5 getbaidu6 autorun最后1 改进方向2 源码地址-GitHub3 0. 先放几个图……RunnerUp为我的ID,之后有可能会改掉。Runne原创 2016-03-09 23:54:58 · 1613 阅读 · 0 评论 -
Python3 urllib 笔记
urllib1. requestrequest存在于urllib库中,导入方法: from urllib import request1.1 urlopenurlopen的方法以及参数如下:urlopen(url, data=None, timeout=socket._GLOBAL_DEFAULT_TIMEOUT, *, cafile=None, capath=None, cadefault=Fa原创 2016-02-29 00:43:56 · 811 阅读 · 0 评论