【鹿桓】
码龄1年
求更新 关注
提问 私信
  • 博客:4,386
    4,386
    总访问量
  • 3
    原创
  • 53
    粉丝
  • 8
    关注
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:重庆市
加入CSDN时间: 2024-04-20

个人简介:创作萌新,初来乍到,请多指教∠(`ω´*)敬礼

博客简介:

2401_84513239的博客

查看详细资料
个人成就
  • 获得67次点赞
  • 内容获得1次评论
  • 获得51次收藏
  • 原力等级
    原力等级
    0
    原力分
    27
    本月获得
    0
创作历程
  • 3篇
    2024年
成就勋章

TA关注的专栏 0

TA关注的收藏夹 0

TA关注的社区 1

TA参与的活动 0

兴趣领域 设置
  • Python
    python
  • 数据结构与算法
    线性回归支持向量机
  • 大数据
    jsonspark
  • 前端
    css正则表达式html
  • 后端
    爬虫架构
  • 移动开发
    微信小程序
  • 最近
  • 文章
  • 专栏
  • 代码仓
  • 资源
  • 收藏
  • 关注/订阅/互动
更多
  • 最近

  • 文章

  • 专栏

  • 代码仓

  • 资源

  • 收藏

  • 关注/订阅/互动

  • 社区

  • 帖子

  • 问答

  • 课程

  • 视频

搜索 取消

爬虫[当当(6000条数据)XPATH]

file = csv.DictWriter(csvfile, fieldnames=["书名", "价格", "作者", "出版社", "评论", "介绍"])csvfile = open("当当文集.csv", "w", encoding="utf-8", newline="")a["介绍"] = information。author = ["空"]a["评论"] = comment。a["作者"] = author。a["出版社"] = press。a["价格"] = price。
原创
发布博客 2024.08.02 ·
1500 阅读 ·
24 点赞 ·
0 评论 ·
9 收藏

基于python的二手房数据爬取与分析

为了更清晰地查看具体的重复值,我们借助print(data[data.duplicated()])打印出了重复值的详细信息,为了确保数据的准确性和简洁性,我们采用了data.drop_duplicates(inplace=True)方法来删除当前的重复项。然后,通过Xpath表达式定位到需要提取信息的节点,并使用相应的方法提取出所需的信息,如房屋地址、名称、房间数目、朝向、其他信息、总价、每平方的价钱和建造年份等。它将复杂的数据转化为易于理解的视觉元素,帮助人们发现数据中的模式、趋势和关系。
原创
发布博客 2024.07.31 ·
2318 阅读 ·
36 点赞 ·
0 评论 ·
37 收藏

Python绘图

原创
发布博客 2024.07.26 ·
568 阅读 ·
7 点赞 ·
1 评论 ·
5 收藏