Python中用feedparser解析RSS

最新推荐文章于 2024-08-10 07:26:54 发布

tianbwin2995

最新推荐文章于 2024-08-10 07:26:54 发布

阅读量1.8k

点赞数

分类专栏： Python

本文链接：https://blog.csdn.net/tianbwin2995/article/details/50764012

版权

Python 专栏收录该内容

29 篇文章 0 订阅

订阅专栏

RSS 是用于分发 Web 站点上的内容的摘要的一种简单的 XML 格式。

一、feedparser的安装

下载一个安装包，然后用Windows命令行cd到那个目录下面输入 python setup.py install 如果不行，那么先双击一次setup.py 再输入

feedparser解析RSS的函数：parse

代码：

 d = feedparser.parse('http://feed.cnblogs.com/blog/u/161528/rss')

【里面的网址可以随你更改，不过貌似最后都要/rss】

这时候rss的全部内容就都在这个d里面了

我们可以看一下，此时有了全部RSS内容的d长啥样

首先给出简化的我的博客的rss

 1 <?xml version="1.0" encoding="utf-8"?>
 2 <feed xmlns="http://www.w3.org/2005/Atom">
 3     <title type="text">博客园_mrbean</title>
 4     <subtitle type="text">**********************</subtitle>
 5     <id>uuid:32303acf-fb5f-4538-a6ba-7a1ac4fd7a58;id=8434</id>
 6     <updated>2014-05-14T15:13:36Z</updated>
 7     <author>
 8         <name>mrbean</name>
 9         <uri>http://www.cnblogs.com/MrLJC/</uri>
10     </author>
11     <generator>feed.cnblogs.com</generator>
12     <entry>
13         <id>http://www.cnblogs.com/MrLJC/p/3715783.html</id>
14         <title type="text">用python读写excel（xlrd、xlwt） - mrbean</title>
15         <summary type="text">最近需要从多个excel表里面用各种方式整...</summary>
16         <published>2014-05-08T16:25:00Z</published>
17         <updated>2014-05-08T16:25:00Z</updated>
18         <author>
19             <name>mrbean</name>
20             <uri>http://www.cnblogs.com/MrLJC/</uri>
21         </author>
22         <link rel="alternate" href="http://www.cnblogs.com/MrLJC/p/3715783.html" />
23         <link rel="alternate" type="text/html" href="http://www.cnblogs.com/MrLJC/p/3715783.html" />
24         <content type="html">最近需要从多个excel表里面用各种方式整理一些数据，虽然说原来用过java做这类事情，但是由于最近在学python，所以当然就决定用python尝试一下了。发现python果然简洁很多。这里简单记录一下。（由于是用到什么学什么，所以不算太深入，高手勿喷，欢迎指导）一、读excel表读excel要用...<img src="http://counter.cnblogs.com/blog/rss/3715783" width="1" height="1" alt=""/><br/><p>本文链接：<a href="http://www.cnblogs.com/MrLJC/p/3715783.html" target="_blank">用python读写excel（xlrd、xlwt）</a>，转载请注明。</p></content>
25     </entry>
26 </feed>