python爬取新浪新闻

最新推荐文章于 2024-05-20 21:35:11 发布

双子素人

最新推荐文章于 2024-05-20 21:35:11 发布

阅读量1.8k

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/qq_26920153/article/details/81944659

版权

最近公司项目比较少，楼主闲了好长时间了，作为一个刚毕业几个月的新人，心里很烦躁，只能自己找点新东西去学了。看到周围好多人都接触了爬虫，再加上楼主最近沉迷吴宣仪不可自拔，每天投票投票，投票的同时需要监控票数涨幅，爬虫再适合不过了，于是决定开始学习python这门语言。（python配置环境网上很多，开发工具楼主用的pycharm，可以网上百度破解方法）。

python入门的话首先找一个网站练手，楼主找的新浪网新闻，爬取这些新闻网站，对于开发者来说，一定要先去找其有没有对开发者开放的开发接口，一般新闻网站都有自己的rss开发接口，这种网站对于开发者来说很方便，可以很轻松的获取到数据，若直接从新闻网爬取，有很多广告会干扰你。

废话有点多昂，赶紧上代码！！！

config.ini为配置文件，为方便后期修改，将爬虫的一些信息从代码中抽离出，源码如下

[info]
postUrl = http://bigdata.ossou.cn/api/pythonSave
scrapyUrl = http://rss.sina.com.cn/news/china/focus15.xml
patternUrl = http://news.sina.com.cn/.*?.shtml
patternImage = http://n.si

最低0.47元/天解锁文章

双子素人

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
2
评论
python爬取新浪新闻

最近公司项目比较少，楼主闲了好长时间了，作为一个刚毕业几个月的新人，心里很烦躁，只能自己找点新东西去学了。看到周围好多人都接触了爬虫，再加上楼主最近沉迷吴宣仪不可自拔，每天投票投票，投票的同时需要监控票数涨幅，爬虫再适合不过了，于是决定开始学习python这门语言。（python配置环境网上很多，开发工具楼主用的pycharm，可以网上百度破解方法）。python入门的话首先找一个网站练手，楼...
复制链接

扫一扫

专栏目录