![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
文章平均质量分 79
senjay
生前何必久睡,死后自会长眠
展开
-
requests模拟登录(基础向)以及打印成pdf时使用pdfkit时出现的一些问题
需求时这样的:学校有一个判题网,当期末的时候要把提交的结果一页一页的打印成pdf交给老师 因为是内网,模拟登录十分简单我就简单写一下,但是我在使用pdfkit时出现了一些问题(强迫症问题),最终也没找到很好的解决方法,如果有dalao有想法恳请告诉 - -! 环境: python3.6 涉及的库: requests pdfkit re 1.模拟登录 登录的url如上 我们关注hearder里最后...原创 2018-10-13 02:26:53 · 1558 阅读 · 1 评论 -
12306余票及票价查询
还原整个思路,遇到的一些问题也会写出来,纯新手向 1.url分析 先打开12306的余票查询,我用的是火狐浏览器,按F12打开调试工具选择network(网络)选项,选择出发地,目的地,日期,点击查询 (小白问题:调试窗口里啥也没有是因为 你一番操作猛如虎,结果完事后想起:哎?调试窗口没打开!) 右上角有一排选项,咱选js,xhr 然后从这一条条里找出我们需要的链接(点的时候在右边选择响应,可以...原创 2018-10-09 00:48:20 · 529 阅读 · 0 评论 -
爬取微博热搜榜单存入mysql并部署在云服务器上
环境: python3.5.2 涉及的库: requests bs4 pymysql 服务器: Ubuntu16.04 1.代码 import requests import datetime import time import pymysql from bs4 import BeautifulSoup import random hottime=''#时间 sql = "insert into...原创 2018-10-19 00:15:17 · 553 阅读 · 0 评论