Python
熊猫路人
当你发现自己的才华撑不起野心时,就请安静下来学习吧。
展开
-
reqeusts模块的学习
使用事前 pip install reqeusts 发送get, post请求, 获取响应 response = requests.get(url) #发送get请求,请求url地址对应的响应 response = requests.post(url,data={请求体的字典}) #发送post请求 response的方法 response.text 该方式往往会出现乱码.出...原创 2020-03-15 17:49:15 · 235 阅读 · 0 评论 -
爬虫概念、工具和HTTP
1.什么是爬虫 爬虫就是模拟客户端(浏览器)发送网络请求, 获取响应, 按照规则提取数据的程序 模拟客户端(浏览器)发送网络请求 : 照着浏览器发送一模一样的请求, 获取和浏览器一模一样的响应数据 2.爬虫的数据去哪里了 呈现出来: 展示在页面上, 或者展示在app上 进行分析: 可以从爬取的的数据中寻找一些规律 3.需要的软件和环境 python3 基础语法 (字符串、列表、字典、判...原创 2020-03-15 14:19:12 · 206 阅读 · 0 评论 -
Linux使用pip遇到的坑
linux 使用软链配置了最新的python,在使用pip安装包时 1,提示ImportError: No module named pip(importorror:没有名为pip的模块) 2,在上面链接执行#yum install zlib 提示: Loaded plugins:fastestmirror Loading mirror speeds from cacheed hostfile F...原创 2020-02-29 21:49:45 · 321 阅读 · 0 评论 -
Python 爬虫小探
Python爬虫原理 :https://www.cnblogs.com/sss4/p/7809821.html 18个Python爬虫实战案例(已开源): https://blog.csdn.net/ch97ckd/article/details/80823328原创 2018-11-17 15:59:59 · 260 阅读 · 1 评论 -
Python学习笔记
1.安装python模块 使用pip pip install [模块名] 2. from ... import 使用 导入模块 fib 的 fibonacci 函数 from fib import fibonacci 3.在python3.3后urllib2已经不能再用,只能用urllib.request来代替 将urllib2给改为urllib.request即可正常运行 #i...原创 2019-02-15 16:58:40 · 185 阅读 · 1 评论 -
Python爬取豆瓣Top 250的电影,并输出到文件. demo,学习篇
''' @time :2019/213 17:55 @desc :通过爬取http://movie.douban.com/top250/得到豆瓣Top 250的电影,并输出到文件movies.txt ''' # import 导入模块 import codecs import requests # 导入模块 bs4 的 BeautifulSoup 函数 from bs4 import B...原创 2019-03-26 17:46:26 · 958 阅读 · 3 评论 -
requests-html快速入门
Python上有一个非常著名的HTTP库——requests,相比大家都听说过,用过的人都说好!现在requests库的作者又发布了一个新库,叫做requests-html,看名字也能猜出来,这是一个解析HTML的库,而且用起来和requests一样爽,下面就来介绍一下它。 安装 安装requests-html非常简单,一行命令即可做到。需要注意一点就是,requests-html只支持Pyth...转载 2019-04-10 10:52:16 · 1664 阅读 · 1 评论