Python
Python学习及爬虫
Astro_zxx
这个作者很懒,什么都没留下…
展开
-
Python 豆瓣源镜像 下载包
用得太多了 写个博客保存一下pip install --user -i https://pypi.douban.com/simple/ itchatitchat 换掉就好原创 2020-04-27 22:08:39 · 1484 阅读 · 0 评论 -
蓝桥杯 C语言 基础练习 杨辉三角形
问题描述杨辉三角形又称Pascal三角形,它的第i+1行是(a+b)i的展开式的系数。它的一个重要性质是:三角形中的每个数字等于它两肩上的数字相加。下面给出了杨辉三角形的前4行:11 11 2 11 3 3 1给出n,输出它的前n行。输入格式输入包含一个数n。输出格式输出杨辉三角形的前n行。每一行从这一行的第一个数开始依次输出,中间使用一个空格分隔。请不要在前面输出多余的空...原创 2020-02-29 23:37:07 · 887 阅读 · 2 评论 -
Python爬虫技术——爬取猫眼电影TOP100榜单
""" 1、爬取猫眼电影 top100榜 1、程序运行直接爬取第一页 2、是否继续爬取 y\n y 爬取第二页 n 爬取结束,谢谢使用 3、把每一页的内容保存到本地 格式 第一页.html 普通版&类版...原创 2020-02-11 12:56:19 · 891 阅读 · 0 评论 -
python 爬虫技术——代理池
""" headers: 是爬虫和反爬虫斗争的第一步 代理 proxies: 代理是反爬虫和爬虫斗争的第二步 获取代理IP的网站: 1.西刺代理 2.快代理 3.全网代理 1.普通代理: proxies = {"协议":"IP 地址:端口号"} 测试:117.91.2...原创 2020-02-11 12:53:06 · 322 阅读 · 0 评论 -
Python——正则表达式,完整笔记
""" 为什么需要正则? 1、文本处理已经成为计算机常见的工作之一 2、对文本内容进行快速搜索定位,提取是比较繁琐和复杂的 3、为了解决这个问题,产生正则表达式 作用: 可以称之为文本的高级匹配模式,提供搜索、替换、查找等功能, 本质是由一系列特殊符号和字符组成的字符串 ...原创 2020-02-11 12:54:45 · 183 阅读 · 0 评论 -
Python 爬虫技术,百度贴吧数据抓取,网页
""" 百度贴吧数据抓取: 要求: 1、输入百度贴吧的名称 2、输入抓取的起始页和终止页 3、把每一页的内容保存到本地:第一页.html、第二页.html"""""" 步骤: 1、找URL的规律(拼接URL) # http://tieba.baidu.com...原创 2020-01-27 22:37:07 · 514 阅读 · 0 评论 -
python爬虫技术 爬取链家二手房信息 保存到本地
""" 爬取链家地址二手房信息 目标:爬取标题名称 地址 总价"""import requestsimport urllib.requestimport urllib.parseimport re# https://bd.lianjia.com/ershoufang/pg1/url = "http://bd.lianjia.com/ershoufang/pg...原创 2020-01-27 22:38:24 · 737 阅读 · 0 评论