自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 selenium爬取京东数据(Chrome)

这里就用xpath提取数据就行,但要注意一点就是京东页面跳转有时候会出现数据加载失败,导致数据无法更新,此时要分别定位最上面和最下面的两个重试按钮并点击。每一页的数据可能会爬得不是很全,会少那么几个。那是因为是网站的问题,会有几个商品的数据一直会加载不出来。标题和评论我用了函数式写法,string(.)是获取该标签写的所有内容,因为有些内容不在同一个标签里。原理就是执行JavaScript模拟鼠标滚动。效果如下(只展示了部分数据)

2024-06-29 00:24:52 695

原创 实现一个简单的DBUtil工具类(Python)

pymysql操作mysql,虽然简单,但每次都要链接数据库,获取cursor,关闭cursor,关闭链接。这些操作无技术含量,还要重复编写!我们应该想法提高开发效率。下面提供一个简易的DBUtil工具类,帮我们解决代码繁琐问题。

2024-06-28 19:23:45 178

原创 SQL语句练习题

sql语句练习

2024-06-25 15:28:52 403

原创 selenium爬取虎牙(Chrome版)

如果是在终端中打印数据有时候只打印了第一页数据,后面的数据没有打印出,可以试试js注入。爬取英雄联盟页面 主播数据。

2024-06-23 18:33:54 308

原创 使用selenium库在必应进行自动输入搜索(Chrome版)

很多初学者可能使用selenium在必应上搜索时无法搜索,原因是现在的必应有个广告图片挡住了搜索框,需要在搜索前把它关掉。

2024-06-22 20:34:28 289

原创 driver谷歌驱动下载地址

driver谷歌驱动

2024-06-20 15:50:04 221

原创 fake_User-Agent.json文件

https://blog.csdn.net/h1773655323/article/details/119924206

2024-06-19 23:06:13 102

SQL语句练习题答案文档

供参考

2024-06-25

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除