爬虫
统计分析分析
同名微信公众号:统计分析分析
展开
-
爬虫day1 get和post 爬豆瓣
1.get 表单提交中get和post方式的区别有5点 1.get是从服务器上获取数据,post是向服务器传送数据。 2.get是把参数数据队列加到提交表单的ACTION属性所指的URL中,值和表单内各个字段一一对应,在URL中可以看到。post是通过HTTPpost机制,将表单内各个字段与其内容放置在HTML HEADER内一起传送到ACTION属性所指的URL地址。用户看不到这个过程。 3.对...原创 2019-04-06 01:10:36 · 853 阅读 · 0 评论 -
day03爬虫
from selenium import webdriver import time browser = webdriver.Chrome() browser.get("http://mail.163.com") time.sleep(3) browser.maximize_window() time.sleep(5) browser.switch_to.frame(0) email = br...原创 2019-04-11 10:56:01 · 150 阅读 · 0 评论 -
爬虫day 2 使用 beautiful soup / xpath
beautiful soup ## 导入相关的库 import requests from bs4 import Beautifulsoup 接下来学习下,beautifulsoup是怎么工作的 Beautiful Soup 是用Python写的一个HTML/XML的解析器,它可以很好的处理不规范标记并生成剖析树(parse tree)。 它提供简单又常用的导航(navigating),搜索...原创 2019-04-08 15:36:03 · 212 阅读 · 0 评论