- 博客(9)
- 收藏
- 关注
转载 登录cookies
cookieCookie 是指某些网站服务器为了辨别用户身份和进行Session跟踪,而储存在用户浏览器上的文本文件,Cookie可以保持登录信息到用户下次与服务器的会话。/p>cookie如何工作当你第一次访问某个网站的时候,服务器会给你颁发一个特定的cookie,之后你每次访问这个站点,你发送的请求头里都会带上相应的cookie,这样服务器便知道这俩请求是同一个客户...
2019-08-22 21:48:00 251
转载 爬取某电影网站 新
主类import reimport requestsimport timefrom scrapy import Selectorfrom Film_website.models import Film# url = 'https://www.88ys.cc'def search(name, num = 1): r = requests.g...
2019-08-19 14:32:00 740
转载 csdn论坛页抓取
抓取csdn论坛实现功能获取论坛分类所有链接,并拼接成推荐精华页的完成的链接获取推荐精华页的帖子状态,赏分,帖子标题,作者,发布时间,回复量,查看量,最后发表时间置顶内容不爬取,只打印置顶内容的帖子标题,作者信息和帖子链接跳过没有内容的版块,并打印出来把获取到的内容添加到数据库未实现功能获取非技术论坛...
2019-08-02 11:18:00 149
转载 str类型转json,str类型转list
python str类型与json格式转换或者list格式转换str转list:import ast#####方法一#####datas = '{"carname":"豫EB7822","simid":"13579246811","equid":"3070614105","username":"燕子","userphone":"13579246811"}'...
2019-07-31 10:04:00 380
转载 peewee
字段查看http://docs.peewee-orm.com/en/latest/peewee/models.html#fields方法使用https://blog.csdn.net/qq_39620483/article/details/87340666转载于:https://www.cnblogs.com/Ly-233/p/11264846.html...
2019-07-29 16:47:00 108
转载 xpath
1.安装安装c++budildtools使用该网站搜索并下载lxmlTwistedScrapy使用cmd打开到下载文件的目录输入pip install {文件名}2.xpath简介xpath可以使用路径表达式在xml和html中导航xpath包含标准函数库xpath是w3c标准的主要元素,并且XQuery和XPointer都构建 XPa...
2019-07-28 16:12:00 96
转载 bs4-BeautifulSoup
1.BeautifulSoup下载pip install BeautifulSoup4 或者 pip install bs4pip install lxml #解析器2.BeautifulSoup支持的解析器解析器使用方法优势劣势python标准解析库BeautifulSoup(markup, "html.pars...
2019-07-28 15:39:00 95
转载 python正则表达式
正则表达式使用re模块常用字符 .匹配除换行符(\n)以外的任意字符\w匹配字母或数字或下划线或汉字0-9、a-z、A-Z、_(下划线)、汉字和其他国家的语言符号\W匹配非字母或数字或下划线或汉字\s匹配任意空白字符...
2019-07-18 14:44:00 53
转载 爬取某电影网站(未写完)
1 import requests 2 import bs4 3 import lxml 4 import re 5 import time 6 from bs4 import BeautifulSoup 7 #网站 8 url = 'https://www.88ys.cc' 9 #电影或电视剧的名字 10 film = '...
2019-07-18 10:35:00 5457
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人