![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python_爬虫
文章平均质量分 64
wayneQT
这个作者很懒,什么都没留下…
展开
-
正则表达式
基础匹配规则\w 匹配字母数字及下划线\W 匹配非字母数字下划线\s 匹配任意空白字符,等价于 [\t\n\r\f].\S 匹配任意非空字符\d 匹配任意数字,等价于 [0-9]\D 匹配任意非数字\A 匹配字符串开始\Z 匹配字符串结束,如果是存在换行,只匹配到换行前的结束字符串\z 匹配字符串结束\G 匹配最后匹配完成的位置\n 匹配一个换行符\t原创 2017-11-28 20:45:22 · 283 阅读 · 0 评论 -
beautifulsoup 学习
今天发现一个有意思的、值得注意的地方,先记录下来,第五行声明了一个BeautifulSoup对象,res选取了他的ol的内容,此时的res是个list,当我取出list 的值后,发现他又是一’tag‘对象,开始的soup 也是一个tag对象,也就是说,list是tag对象的集合,所以我开始,企图再次声明一个BeautifulSoup对象是会报错了,取出的contents bong不是成为了一个str原创 2017-11-29 21:51:07 · 282 阅读 · 0 评论 -
jupyter 初步
在anaconda中,pip3可以直接安装;命令行直接打开;命令:jupyter notebook; 关于jupyter 的一些介绍(来源网上) Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码原创 2017-11-27 19:30:18 · 277 阅读 · 0 评论 -
py 爬虫 requests库 用法(一)//源码
In [4]: print(“hello”) hello In [3]: import requests import urllib In [7]: print(1+2) 3 测试¶In [17]: import requests res=requests.get(“http://httpbin.org/get“) print(res.text) { “args”:原创 2017-11-27 21:24:42 · 393 阅读 · 0 评论 -
用爬虫做一个翻译“客户端”
前提前些时,要考专业英语了,看见室友一边对着百度翻译,一边复习单词,心生一想法,页面明显是动态加载出来的,我能不能抓到它返回的东西,然后提取出来,这样可以弄成以个客户端,可以试一试。观察打开百度翻译的页面,调用浏览器的开发者模式,输入一个“你好”,然后刷新,观察请求在哪里,其实挺简单的,一下子就可以看到,请求,如下图![请求观察](http://img.blog.csdn.net/2017122原创 2017-12-28 19:27:30 · 1469 阅读 · 0 评论 -
pyquery 的一些用法
pyquery 相关用法pyspider 的内容选择器默认已经实例化一个pyquery对象,可以直接使用pyquery的api来获取自己需要的内容。在pyquery中使用response.doc就可以直接实例化一个pyquery对象,就可以直接在里面使用pyquery方法了,html()和text()获取相应的HTML块或文本块,根据HTML标签来获取元素,例:html:'<div>&...原创 2018-03-14 13:03:29 · 463 阅读 · 0 评论