weixin_42229626
码龄7年
关注
提问 私信
  • 博客:8,285
    8,285
    总访问量
  • 4
    原创
  • 540,404
    排名
  • 14
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:江西省
  • 加入CSDN时间: 2018-05-17
博客简介:

weixin_42229626的博客

查看详细资料
个人成就
  • 获得16次点赞
  • 内容获得4次评论
  • 获得136次收藏
  • 代码片获得286次分享
创作历程
  • 2篇
    2021年
  • 4篇
    2018年
成就勋章
TA的专栏
  • python爬虫实例
    2篇
  • python学习笔记
    3篇
  • linux系统学习笔记
  • 小知识
    1篇
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

xpath 多层地址中间部分模糊定位

在使用 XPATH 爬取京东商品信息的是否,发现部分京东自营商品的定位地址和其他商品在层数上回不一样比如说特别的//*[@id="J_goodsList"]/ul/li[14]/div/div/div[2]/div[1]/div[3]/a一般的//*[@id="J_goodsList"]/ul/li[8]/div/div[3]/a可以发现中间在li后面多了3层div开始的思路是 用通配符. *写成//*[@id="J_goodsList"]/ul/li[@xxx=""]/*/div[
原创
发布博客 2021.09.03 ·
838 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

Python + selenium 爬取淘宝商品列表及商品评论 2021-08-26

Python + selenium 爬取淘宝商品列表及商品评论[2021-08-26]主要内容登录淘宝获取商品列表获取评论信息存入数据库需要提醒主要内容通过python3.8+ selenium 模拟chrome操作进行淘宝商品列表及评论的爬取还存在以下问题:需要人扫二维码登录以便于绕过反爬机制(后面再优化)评论爬取耗时比较长,因为页面加载完整后才能进行评论的爬取,而各类商品详情页的图片数量不同,导致加载时间不同,有的甚至要加载1-2min(也可能是公司网限制了购物网站的网速)整体思路:通过扫
原创
发布博客 2021.08.26 ·
3410 阅读 ·
3 点赞 ·
2 评论 ·
75 收藏

面向对象以及面向过程编程的区别

最近在学习python 以及 c 和同事聊了下,这两种语言的优缺点…关于面向对象和面向过程半天说不清楚,所以网上搜索了下…发现这片文章说的很贴切,特此转发如下:用面向过程的方法写出来的程序是一份蛋炒饭,而用面向对象写出来的程序是一份盖浇饭。所谓盖浇饭,北京叫盖饭,东北叫烩饭,广东叫碟头饭,就是在一碗白米饭上面浇上一份盖菜,你喜欢什么菜,你就浇上什么菜。我觉得这个比喻还是比较贴切的。蛋炒饭制...
转载
发布博客 2018.11.07 ·
307 阅读 ·
1 点赞 ·
0 评论 ·
2 收藏

vmware 虚拟机下配置centos7.x 网络设置

http://blog.51cto.com/11934539/2050458vmware 虚拟机下配置centos7.x 网络设置
转载
发布博客 2018.10.15 ·
206 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

PowerDesigner16.5 下载地址含补丁

发布资源 2018.10.15 ·
txt

python pyqt5 时间进度

发布资源 2018.09.26 ·
py

python 小说爬虫+ui+多线程

爬虫主要是bs4 beautifulsoup库 和 urllib 库 ui 是 pyqt5库如果是希望通过ui反馈实施爬取进度,必须用多线程,否则ui会假死先说爬虫 主要是通过biqukan这个网站爬取逻辑是: 1.先获得小说章节列表,形成一个只有key,没有value的字典.以及一个各章节网址的列表 2.通过每个章节循环获得章节内容,更新到字典中去 3.把字典输出到txt....
原创
发布博客 2018.08.23 ·
1306 阅读 ·
1 点赞 ·
0 评论 ·
3 收藏

关于Python NumPy 库中 arr.transpose 方法的心得记录

利用python进行数据分析中第二版第四章有关于 NumPy库的介绍, 有关于 arr.transpose 方法的心得记录如下: arr = np.arange(16).reshape(2,2,4)结果就是array([[[ 0, 1, 2, 3], [ 4, 5, 6, 7]], [[ 8, 9, 10, 11], ...
原创
发布博客 2018.08.15 ·
2220 阅读 ·
10 点赞 ·
2 评论 ·
15 收藏

熵权法EXCEL实例

发布资源 2018.05.17 ·
xlsx