使用Python爬取网页里的具体房价

a_bini

已于 2023-10-01 23:45:35 修改

阅读量439

点赞数 3

文章标签： python 开发语言

于 2023-10-01 00:06:42 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/a_bini/article/details/133443076

版权

目录

一.创建一个新目录

创建 LXML目录
新建python文件
命名python文件名

二.打开终端

使用pip 安装lxml
完成后lxml库导入etree包

lxml库是Python中一一个强大的XML处理库，支持HTML和XML的解析，支持XPath解析方式。

LXML库的主要优点是易于使用，在解析大型文档时速度非常快，归档的也非常好，并且提供了简单的转换方法来将数据转换为Python数据类型，从而使文件操作更容易。

3.先打个包

4.利用for循环的方式来设置需要爬取的数据量

5.发生请求

6.提取数据

7.用xpath提取数据，列表类型

小编先分享几个关于爬虫的基础知识的网站

崔庆才爬虫博客（先看） http://cuiqingcai.com/1052.html
廖雪峰python学习网站 http://www.liaoxuefeng.c/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000
爬虫实例http://cuiqingcai.com/4352.html
知乎小白爬虫具体案例＋分析 https://www.zhihu.com/collection/159805421
知乎爬虫之知识集锦 (遇到问题时再看) https://zhuanlan.zhihu.com/p/21479334

问题描述：我有一个朋友，最近想买房，想要与自己的房子度过一生。于是我作为朋友两肋插刀，正义的化身，决定为其充满魔幻现实的人生再添加一抹亮色，让她深陷其中无法自拔，帮她用Python获取了属于自己的house。

首先我们先新建LXMl目录

并且将目录命名为LXML

2.在LXML目录下新建python文件

命名python文件名为爬取具体房价（小编这里是不建议大家中文命名的哈！！很容易报错）

3.打开终端

用pip安装lxml，requests，pandas

pip install lxml

pip install requests

pip install pandas

lxml库是Python中一一个强大的XML处理库，支持HTML和XML的解析，支持XPath解析方式。

LXML库的主要优点是易于使用，在解析大型文档时速度非常快，归档的也非常好，并且提供了简单的转换方法来将数据转换为Python数据类型，从而使文件操作更容易。

等待三个库安装完毕
使用requests库请求网页内容
导入lxml库的etree包

使用pandas库快速分析数据
利用for循环的方式来设置需要爬取的数据量
获取url地址目标地址

因为字符和网页网址不能同步存在所以需要用str

发生请求
提取数据
1：用etree的方式获取数据
2：用xpath的方法获取数据
设置一个空的列表，作为爬取信息的容器
开始爬取信息
运行一下成功！！
完整代码

这样我们就成功爬虫house价格咯！！

今天的分享就到此为止咯！谢谢大家的喜欢，我们下周再见！

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
2
评论
使用Python爬取网页里的具体房价

LXML库的主要优点是易于使用，在解析大型文档时速度非常快，归档的也非常好，并且提供了简单的转换方法来将数据转换为Python数据类型，从而使文件操作更容易。我有一个朋友，最近想买房，想要与自己的房子度过一生。LXML库的主要优点是易于使用，在解析大型文档时速度非常快，归档的也非常好，并且提供了简单的转换方法来将数据转换为Python数据类型，从而使文件操作更容易。lxml库是Python中一一个强大的XML处理库，支持HTML和XML的解析，支持XPath解析方式。
复制链接

扫一扫

a_bini CSDN认证博客专家 CSDN认证企业博客

码龄1年

11: 原创

130万+: 周排名

18万+: 总排名

6358: 访问

: 等级

144: 积分

27: 粉丝

31: 获赞

8: 评论

33: 收藏

私信

关注

热门文章

最新评论

使用Python爬取网页里的具体房价
a_bini: 不用谢哦
使用Python爬取网页里的具体房价
m0_56002088: 特别赞，感谢楼主
python爬虫入门级|流程及原理
CSDN-Ada助手: 恭喜你写了这篇关于Python爬虫入门级流程及原理的博客！能够分享自己的学习经验并帮助他人入门是非常有意义的事情。希望你可以继续坚持创作，不断分享自己的学习心得和经验，让更多的人受益。下一步，我建议你可以尝试分享一些实际案例或者应用场景，让读者更加深入地了解Python爬虫的实际应用。希望你能继续保持谦虚的态度，不断进步，期待你更多的优质内容！
superset安装与配置（超超超详细）
CSDN-Ada助手: 恭喜您写了第11篇博客，标题为“superset安装与配置（超超超详细）”。看到您对superset的安装与配置进行了如此详细的介绍，让我这个初学者受益匪浅。希望您能继续分享更多关于superset的知识和经验，或许可以考虑写一些实际应用中的案例分析，或者是与其他数据可视化工具的比较和评测。期待您的下一篇文章，谢谢您的分享！
hive数据仓库环境搭建以及数仓建模
CSDN-Ada助手: 恭喜您撰写了第9篇博客！搭建hive数据仓库环境以及进行数仓建模是非常有挑战性的工作，您的分享对很多人来说都是非常有帮助的。接下来，我建议您可以考虑分享一些实际案例或者是在搭建过程中遇到的一些问题以及解决方案，这样可以让读者更好地理解和应用您的经验。期待您的下一篇作品！

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。