Python爬虫入门教程23:A站视频的爬取,解密m3u8视频格式
Python爬虫入门教程25:绕过JS加密参数,实现批量下载抖某音无水印视频内容
Python爬虫入门教程27:爬取某电商平台数据内容并做数据可视化
Python爬虫入门教程28:爬取微博热搜榜并做动态数据展示
Python爬虫入门教程29:爬取某团烤肉店铺数据内容并做可视化展示
PS:如有需要 Python学习资料
以及 解答
的小伙伴可以加点击下方链接自行获取
-
Python 3.8
-
Pycharm
import requests
import parsel
import csv
安装Python并添加到环境变量,pip安装需要的相关模块即可。
‘地区’, ‘店名’, ‘标题’, ‘价格’, ‘浏览次数’, ‘卖家承诺’, ‘在售只数’,
‘年龄’, ‘品种’, ‘预防’, ‘联系人’, ‘联系方式’, ‘异地运费’, ‘是否纯种’,
‘猫咪性别’, ‘驱虫情况’, ‘能否视频’, ‘详情页’
这些数据, 都是要获取下来的, 虽然说需要的数据比较多, 但是这个网站相对而言还是很简单的, 因为没有什么反爬的措施.
获取数据
url = ‘http://www.maomijiaoyi.com/index.php?/chanpinliebiao_c_2.html’
headers = {
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.90 Safari/537.36’
}
response = requests.get(url=url, headers=headers)
selector = parsel.Selector(response.text)
href = selector.css(‘div.content:nth-child(1) a::attr(href)’).getall()
areas = selector.css(‘div.content:nth-child(1) a .area span.color_333::text’).getall()
areas = [i.strip() for i in areas]
zip_data = zip(href, areas)
for index in zip_data:
http://www.maomijiaoyi.com/index.php?/chanpinxiangqing_546549.html
index_url = ‘http://www.maomijiaoyi.com’ + index[0]
response_1 = requests.get(url=index_url, headers=headers)
selector_1 = parsel.Selector(response_1.text)
area = index[1] # 地区
shop = selector_1.css(‘.dinming::text’).get().strip() # 店名
title = selector_1.css(‘.detail_text .title::text’).get().strip() # 标题
price = selector_1.css(‘span.red.size_24::text’).get() # 价格
views = selector_1.css(‘.info1 span:nth-child(4)::text’).get() # 浏览次数
promise = selector_1.css(‘.info1 div:nth-child(2) span::text’).get().replace('卖家承诺: ', ‘’) # 卖家承诺
sale = selector_1.css(‘.info2 div:nth-child(1) div.red::text’).get() # 在售
age = selector_1.css(‘.info2 div:nth-child(2) div.red::text’).get() # 年龄
breed = selector_1.css(‘.info2 div:nth-child(3) div.red::text’).get() # 品种
safe = selector_1.css(‘.info2 div:nth-child(4) div.red::text’).get() # 预防
people = selector_1.css(‘div.detail_text .user_info div:nth-child(1) .c333::text’).get() # 联系人
phone = selector_1.css(‘div.detail_text .user_info div:nth-child(2) .c333::text’).get() # 联系方式
fare = selector_1.css(‘div.detail_text .user_info div:nth-child(3) .c333::text’).get().strip() # 异地运费
purebred = selector_1.css(
‘.xinxi_neirong div:nth-child(1) .item_neirong div:nth-child(1) .c333::text’).get().strip() # 是否纯种
sex = selector_1.css(
‘.xinxi_neirong div:nth-child(1) .item_neirong div:nth-child(4) .c333::text’).get().strip() # 猫咪性别
worming = selector_1.css(
‘.xinxi_neirong div:nth-child(2) .item_neirong div:nth-child(2) .c333::text’).get().strip() # 驱虫情况
video = selector_1.css(
‘.xinxi_neirong div:nth-child(2) .item_neirong div:nth-child(4) .c333::text’).get().strip() # 能否视频
dit = {
‘地区’: area,
‘店名’: shop,
‘标题’: title,
‘价格’: price,
‘浏览次数’: views,
‘卖家承诺’: promise,
自我介绍一下,小编13年上海交大毕业,曾经在小公司待过,也去过华为、OPPO等大厂,18年进入阿里一直到现在。
深知大多数Python工程师,想要提升技能,往往是自己摸索成长或者是报班学习,但对于培训机构动则几千的学费,着实压力不小。自己不成体系的自学效果低效又漫长,而且极易碰到天花板技术停滞不前!
因此收集整理了一份《2024年Python开发全套学习资料》,初衷也很简单,就是希望能够帮助到想自学提升又不知道该从何学起的朋友,同时减轻大家的负担。
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)
png)
既有适合小白学习的零基础资料,也有适合3年以上经验的小伙伴深入学习提升的进阶课程,基本涵盖了95%以上前端开发知识点,真正体系化!
由于文件比较大,这里只是将部分目录大纲截图出来,每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频,并且后续会持续更新
如果你觉得这些内容对你有帮助,可以扫码获取!!!(备注:Python)