旧文

【转】如何订阅不提供RSS Feed输出的网站?
2010-11-17 10:54 阅读(1)

//不提供RSS订阅的网站的确很讨厌,但也不是没办法,收藏被墙网站“可能吧”文章一篇。不过此文不能解决网站只是文章内容部分输出的问题(至于全文输出,可能吧内有相关文章,google之即可)。另外后面附上几个重要的评论。

订阅能节省很多时间,使获得信息变得高效。但目前在国内很多网站并不提供Feed输出,比如一些大型的门户,例如新浪、搜狐等等。它们害怕这样会损失流量。而像我这样的很多人都希望在阅读器里就完成所有信息的获取。我每天都关注F1的最新动态,由于新浪F1不提供RSS输出,我不得不每次都要到网站上看。这样浪费了我不少的时间。有什么办法可以订阅不提供RSS Feed输出的网站呢?

如何订阅不提供RSS Feed输出的网站?

1、利用Google资讯

也许国内使用Google资讯的人并不多,Google 资讯是一个由计算机生成的资讯网站。它汇集了来自中国大陆超过1,000 个中文资讯来源的新闻资源,并将相似的报道组合在一起,根据读者的个人喜好进行显示。

Google资讯支持RSS或Atom的Feed输出,通过设定一些关键词我们可以利用Google资讯订阅不提供Feed输出的网站。

比如我要订阅新浪F1,怎样通过Google资讯订阅呢?通过观察我发现,新浪F1的每一篇新闻的URL是有规律的,都是 sports.sina.com.cn/f1/日期/数字.shtml 的形式的,我在Google资讯里通过”inurl:f1 site:sina.com.cn”将新浪F1里的新闻全部找了出来,经核实发现没有其它新闻混杂在里面。

(Google资讯条目(上)与新浪F1新闻条目(下)对比)

这时页面左边的RSS或Atom链接即是新浪F1的Feed输出了。

后来我觉得光是新浪F1的新闻并不足够,就加上了搜狐F1的新闻。因为搜狐F1的文章URL里也含有F1,这样操作就简便多了,并不需要分开两个Feed来订阅。具体操作只是扩大搜索范围,关键词更换为”inurl:f1 site:sina.com.cn OR site:sohu.com”

如果某个不提供RSS输出的网站,它的新闻内容都含有特定的文字,比如“XXXXXXXXXXXXX-新华网YY频道”,这时我们可以用“intitle:新华网YY频道 site:某个网站”来限定新闻的范围。

对于URL或新闻标题有规律的资讯类网站,使用Google资讯为其烧制一个Feed是很不错的选择。

事实上百度新闻也支持Feed输出,但百度不支持inurl和intitle搜索,所以并不能准确地将某些特定的新闻区分出来。

2、使用在线Feed创建工具

有些我们想订阅的网站的文章URL没有什么规律,很难用Google资讯来订阅,这时我们可以使用一些在线的Feed烧制网站。

有不少网站提供Feed烧制,只要提供网站地址,剩下的操作一般是选择烧制的区域或点击两个要烧制内容的链接。

但使用这些服务烧制出来的Feed只含有标题和链接,并不像Google资讯那样有内容摘要。

列举一些:

http://dapper.net/

这个可能吧以前介绍过。功能强大,定制强度很高。

http://feed43.com

这个使用起来可能会有点难度,对不熟悉网页编程的人可能会有点困难。但定制强度很高。

http://www.ponyfish.com/

这个操作简单,可定制性强, 推荐使用。

这是我使用PonyFish烧制的新浪F1的Feed:http://www.ponyfish.com/feeds/29286buFtQdtt

如果你还有更好的订阅不提供RSS Feed输出的网站的方法,不妨和大家分享一下!

原文地址:http://www.kenengba.com/post/390.html
原文短网址:http://knb.im/6h

评论:
zing 发表于 2008-03-05,11:18 pm
No.2
我通常用的是page2rss,还是比较方便的。

http://www.page2rss.com/

//该网站貌似已被墙

99 发表于 2008-03-08,5:33 pm
No.4
http://feed.lookou.com/CreateFeed.aspx
入口网的
beta阶段 效果不怎么明显 也就是说抓取对有些站来说好 有些不好

Dec. 发表于 2008-03-29,5:15 pm
No.9
第一种方法似乎只可以用于已经被google资讯 baidu新闻 收录过的网站/稿源,没有收录过的就没有办法了(不过可以考虑向google提交你推荐的资讯稿源)

旧文》上有1个想法

  1. Pingback引用通告: 一次次擦身而过 | Thank you, Sami! United States WordPress Unknow Os

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注