python-requests

requests:是一个Python第三方库,编写爬虫和测试服务器响应数据时经常会用到

安装pip install requests

数据爬虫流程
  1. 确定需求
  2. 数据来源
  3. 网站分析
  4. 编写爬虫代码
  5. 数据提取
  6. 存储数据
  • 需求:代码实现爬取链家租房价格信息
    在这里插入图片描述
  • 请求地址
import requests
base_url='https://bj.lianjia.com/zufang/'

在这里插入图片描述

  • 模拟发送请求头(伪装游览器)

header={"User-Agent":"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Saf
ari/537.36"}
  • 发送求情
response=requests.get(base_url,headers=header)
  • 获取网站返回的内容
text=response.text
  • 提取数据
#xpath 通过路径获取想要的数据 xml一种数据结构 展示数据
#json  json存储数据
#安装lxml包 pip install lxml
from lxml import etree
# xpath的使用
#实例化对象
html=etree.HTML(text)
# 编写路径规则
# / 根   // 当前路径
title=html.xpath('//p[@class="content__list--item--title twoline"]/a/text()')
print(title,sep=' ')
money=html.xpath('//span[@class="content__list--item-price"]/em/text()')
print(money)

结果

['\n          整租?房山超级蜂巢 1室1厅 西        ', '\n          整租?管庄西里 2室1厅 南/北        ', '\n          整租
?熔炼厂宿舍 11厅 南        ', '\n          整租?红松园小区 31厅 南/', '\n          整租?模式口西里 21厅 南        ', '\n          整租?远洋一方润园6号院 21厅 东/西        ', '\n          整租?右安门内西街甲2号院 11厅 南        ', '\n          整租?建新南区 21厅 西/', '\n          整租?东泽园 21厅 南        ', '\n          整租?馨港庄园三区 22厅 南/', '\n          整租?九道湾北巷 21厅 南        ', '\n          整租?石园西区 21厅 南/', '\n          整租?交通局家属楼 21厅 东/西        ', '\n          整租?四合巷小区 21厅 南/', '\n          整租?滨河小区 11厅 南/', '\n          整租?滨河小区 21厅 南/', '\n          整租?温泉花园A区 21厅 南/', '\n          整租?松榆西里 20厅 南        ', '\n          整租?鸿博家园一期B区 21厅 南/', '\n          整租?鸿博家园一期B区 21厅 南/', '\n          整租?建新北区 31厅 南/', '\n          整租?良乡西路甲721厅 南/', '\n          整租?义宾南区 21厅 南/', '\n          整租?民旺园 21厅 东/西        ', '\n          整租?隆盛园 21厅 南/', '\n          整租?海棠公社 11厅 西北        ', '\n          整租?天翠阳光新城 11厅 南/', '\n          整租?东方郁金香 1房间 北        ', '\n          整租?金地未未来 11厅 东        ', '\n          整租?天坛东路6421厅 东        ']['2600', '4500', '4400', '5000', '3600', '5000', '4600', '3000', '4900', '3000', '4500', '2800', '3100', '2500', '2800', 
'3000', '2800', '5000', '4700', '4500', '3000', '2600', '3100', '5500', '2350', '3800', '3000', '4300', '3000', '4800']
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值