爬虫
qq_43597756
这个作者很懒,什么都没留下…
展开
-
python学习日志3
9+从3开始,每天学习不仅爬虫一部分,也开始学习django框架,以及docker开发。 爬虫部分——正则学习: 参考资料:[https://www.cnblogs.com/fozero/p/7868687.html] 这里标记几个常用的 \d 等价于 [0-9] \w 单词字符 [A-Za-z0-9_] flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为: re.I 忽略大小写 re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境 re.M 多行模原创 2020-06-10 15:42:27 · 263 阅读 · 0 评论 -
python爬虫学习日志2
在日志1中,以及学习了信息的爬取: # 得到指定一个URL的网页内容 def askURL(url): # 模拟浏览器头部信息 head = { 'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'} # Request封装,用户代理,伪装成浏览器 request = urllib.req原创 2020-06-08 20:30:20 · 148 阅读 · 0 评论 -
python爬虫学习1
python爬虫学习日志 大三上学期开始接触python,发现python是一个非常强大而又美丽的语言,参加比赛的时候主要使用了numpy和pandas,真的“让人着迷”。随着大数据时代的降临,人工智能、大数据开发等都与python息息相关,为了让自己掌握更多的python技能,大三下开始学习爬虫、分词等。 知识准备:html、css、JavaScript的基础知识 主要步骤:1.爬取网页数据、2.解析数据、3.存储数据 学习平台:PyCharm 学习资源:https://www.bilibili.co原创 2020-06-07 19:58:12 · 150 阅读 · 1 评论