利用python爬虫结合前端技能实现经济学人(The Economist)阅时即查APP(00)

该博客系列将介绍如何利用Python爬虫获取经济学人文章列表及内容,进行数据清洗,并结合前端技术,实现点击文章中难词获取翻译、发音等功能。目前完成的阶段包括爬取主页获取最新文章列表。
摘要由CSDN通过智能技术生成

本系列博客将分为以下几篇:

  • 001、python爬取主页,获取最新文章列表
  • 010、python爬取文章列表,归档为本地文件
  • 011、python实现数据清洗,过滤出每篇文章中有一定难度的单词
  • 100、python分别从有道、必应爬取每篇文章中一定难度单词的发音、解释、短语、例句等信息,首选有道,有道失败必应上,实在不行调用扇贝查词API
  • 101、根据文章,以及爬取的对应单词解析文件,生成最终可供请求的json文件
  • 110、前端逻辑简单梳理

先上一下最新的视觉:

带有info标记的单词就是过滤出的有难度的单词,点击即可查看翻译、发音、例句、短语等。

这里写图片描述

00、python爬取主页,获取最新文章列表

1、分析要爬取的网页结构,注意不要在浏览器中直接访问,因为直接访问的文档结构可能是被javascript经过DOM操作改变过的,要将爬取的内容保存为html文件然后在浏览器中打开进行分析

i
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值