![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
爬虫
口袋猫的神奇口袋
我健康我快乐我大有作为!
展开
-
爬虫心得
入职公司已经数周,因为写了不少爬虫,对爬虫的代码有些心得,因此记录一下。 一、获取html页面的方法 通过python获取页面的常用方法有requests和selenium方法,当然使用python自带的urllib也可以获取html页面,但是其使用逻辑实在是复杂,相比之下,requests方法更像是给人类使用的方法。 1、requests可以通过get或者post来获取页面信息,对于使用GET方式的页面,可以使用requests.get(url)来获取相应的网页源代码。POST方式也是常见的网页访问方法,原创 2020-10-02 21:14:06 · 1936 阅读 · 3 评论 -
利用正则表达式爬取官网数据及反反爬虫方法分析
num = 22077 wb = xlwt.Workbook() ws = wb.add_sheet("旅游人数") ws.write(0, 0, "序号") ws.write(0, 1, "时间") ws.write(0, 2, "数据") t = 0 #def pachong(): while True: try: sleep_time = random.randint...原创 2020-02-25 16:27:44 · 418 阅读 · 0 评论