使用Python获取并解析 RSS feed-Feedparser

现在很多网站或博客都支持RSS,读者可以使用RSS阅读器订阅网站的最新内容,例如本博客左侧就有一个“文章RSS”。本帖介绍怎么使用Python获取并解析目标网站的RSS。使用到的模块:Feedparser。

关于RSS,wikipedia的解释非常详细:https://zh.wikipedia.org/wiki/RSS

Feedparser是解析RSS的Python模块,支持多种格式,包括Atom、RSS、xml等。

安装Feedparser

使用pip安装:

示例代码

使用Python获取并解析 RSS feed-Feedparser

遍历feed中所有文章和链接:

使用Python获取并解析 RSS feed-Feedparser

其它常用的元素还有:”description”,”publication date”,”entry ID”,”image”,”categories”,”enclosures”,”cloud”。

还有一个库值的一提-Google开发的Feed JavaScript API,示例:

Feed
实时更新

使用上面代码可以在自己的网站中加入其它网站的最新动态。

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注