python 爬蟲
文章平均质量分 75
Theobalds
这个作者很懒,什么都没留下…
展开
-
關於正則表達式(爬蟲)
一.什麼是正則表達式? 正则表达式是对字符串操作的一种逻辑公式,就是 事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符”,这个“规则字符” 来表达对字符的一种过滤逻辑。 正则并不是python独有的,其他语言也都有正则 python中的正则,封装了re模块 二.常見匹配模式 \w 匹配字母数字及下划线 \W 匹配f非字母数字下划线转载 2017-08-07 09:15:43 · 365 阅读 · 0 评论 -
寫爬蟲前需要思考的
分析頁面數據的方式: 1.查看源代碼 2.查看是否是ajax異步加載(抓包) 3.解密(非常熟悉前端,特別是JS) 1.請求的URL 2.請求方式post 3.請求參數: 最基本的反爬手段:判斷瀏覽器信息转载 2017-08-07 19:25:32 · 306 阅读 · 0 评论 -
關於 python中的selenium 錯誤
今天在學習python中的selenium時出現了一些錯誤,後來解決了,在這裏與大家分享解決方法。 代碼如下: from selenium import webdriver brower = webdriver.Firefox() brower.get('https://www.taobao.com') print(brower.page_source) brower.close()最初的原创 2017-08-11 16:55:35 · 581 阅读 · 0 评论 -
近期學習目標和學習順序(python)
一.學習順序 python------數據結構和算法--------linux----------軟件工程-----------web開發---------git版本控制-------------javascript最初學習完python基礎後,可以試一試入手爬蟲,但是爬蟲不是學習的重心,爬蟲可以暫時增強你的信心,之後可以試着入手web 二.關於爬蟲: 1.掌握基本的python原创 2017-08-20 19:15:27 · 431 阅读 · 0 评论