摘要RSS的价值

Keso又补充了关于RSS调查的废话,我赞成大部分的观点,但对于下面的说法,则有不同的看法:
“我不相信,这样一个大买卖,会从大量残缺的、不知所云的摘要RSS中产生。未来的很多Web应用,将基于RSS而产生,但肯定不是基于非全文的RSS,这是毫无疑问的。想想看,一个只能搜索摘要乃至标题的RSS搜索引擎,能搜出多少有价值的内容?”
基于摘要的RSS有没有价值呢?
如果我要问,新浪或者搜狐哪一个页面最有价值?相信大家不用太多思考就可以答复是首页,那么,你可以从首页看到完整的信息吗?一条就算,回答是不可以。
你肯定看过搜索引擎搜索的结果,有完整的信息吗?回答是没有,但他们提供的简化信息可以辅助你判断是否找到需要的页面。当然你可以跟我说搜索引擎有快照,那是完整的信息,那你使用快照的频率呢?或者当年google被禁止使用快照的时候,google为什么依然有那么多用户?那时候的google有价值吗?
这两个例子说明,信息的价值不一定非要“完整”才能体现。
传统生活中,有很多“摘要”体现价值的例子。
比例尺大的地图,只标注重要的地标,没有详尽内容,进一步查询进入细分的小比例尺地图;浓缩的历史教科书;根据不同专家著作编撰的教科书;图书内页的检索信息;提供了索引信息的电信黄页服务。
摘要性的RSS(Rich Site Summary站点摘要)有用吗?有用的!如果摘要能够部分或者全部反应原文章的内容主旨,利用摘要可以提高信息检索的效率,尤其是用计算机处理自然语言时更明显,关心RSS更多含义的读者,你可以看我早期写的那一篇《解读RSS新闻聚合的未来》,不多说。
RSS是分散信息快速自动整合的工具,如果只整合了摘要,原信息还要通过原站点才能看得见,这是一些人觉得RSS提供全文更有道理的地方。
随着计算机的进步,网站信息不再只通过HTML面向“人”,而且也通过XML面向“机器”,我不过多地解释HTML和XML的含义,只想说,这是信息向自动化处理发展的结果。全文的自动传递没有在RSS的规范中作具体规定,除了在RSS直接传送全文外,我们还可以通过其他的XML来传递全文信息,或者未来扩展RSS标准来同时传递两种信息。
总之,摘要是有意义的,RSS传输全文还是摘要确实不重要,即便RSS将来全部传递全文,接收RSS的网站完全可能甚至必须自己生成摘要来提高内容检索效率。不过RSS既然定义是网站摘要(Rich Site Summary),也是有道理的,当然也没有必要让工具来限制我们。
其实,只提供摘要的RSS也可以让用户不用再点击而直接阅读,RSS阅览器可以设计成将原始页面放到每个摘要的下面,这并没有什么技术难题,RSS阅览器现在这个不争气的模样,是RSS应用水平还不成熟的结果。
更新:欢迎大家拍砖去:点击进入本文拍砖
更新2:流水渡留言提到价值是伪问题,确实有点伪,我具体说明一下价值的含义,指现阶段一个页面的广告价值。
Web Counters51.la Free Site Stats
Keso又补充了关于RSS调查的废话,我赞成大部分的观点,但对于下面的说法,则有不同的看法:
“我不相信,这样一个大买卖,会从大量残缺的、不知所云的摘要RSS中产生。未来的很多Web应用,将基于RSS而产生,但肯定不是基于非全文的RSS,这是毫无疑问的。想想看,一个只能搜索摘要乃至标题的RSS搜索引擎,能搜出多少有价值的内容?”
基于摘要的RSS有没有价值呢?
如果我要问,新浪或者搜狐哪一个页面最有价值?相信大家不用太多思考就可以答复是首页,那么,你可以从首页看到完整的信息吗?一条就算,回答是不可以。
你肯定看过搜索引擎搜索的结果,有完整的信息吗?回答是没有,但他们提供的简化信息可以辅助你判断是否找到需要的页面。当然你可以跟我说搜索引擎有快照,那是完整的信息,那你使用快照的频率呢?或者当年google被禁止使用快照的时候,google为什么依然有那么多用户?那时候的google有价值吗?
这两个例子说明,信息的价值不一定非要“完整”才能体现。
传统生活中,有很多“摘要”体现价值的例子。
比例尺大的地图,只标注重要的地标,没有详尽内容,进一步查询进入细分的小比例尺地图;浓缩的历史教科书;根据不同专家著作编撰的教科书;图书内页的检索信息;提供了索引信息的电信黄页服务。
摘要性的RSS(Rich Site Summary站点摘要)有用吗?有用的!如果摘要能够部分或者全部反应原文章的内容主旨,利用摘要可以提高信息检索的效率,尤其是用计算机处理自然语言时更明显,关心RSS更多含义的读者,你可以看我早期写的那一篇《解读RSS新闻聚合的未来》,不多说。
RSS是分散信息快速自动整合的工具,如果只整合了摘要,原信息还要通过原站点才能看得见,这是一些人觉得RSS提供全文更有道理的地方。
随着计算机的进步,网站信息不再只通过HTML面向“人”,而且也通过XML面向“机器”,我不过多地解释HTML和XML的含义,只想说,这是信息向自动化处理发展的结果。全文的自动传递没有在RSS的规范中作具体规定,除了在RSS直接传送全文外,我们还可以通过其他的XML来传递全文信息,或者未来扩展RSS标准来同时传递两种信息。
总之,摘要是有意义的,RSS传输全文还是摘要确实不重要,即便RSS将来全部传递全文,接收RSS的网站完全可能甚至必须自己生成摘要来提高内容检索效率。不过RSS既然定义是网站摘要(Rich Site Summary),也是有道理的,当然也没有必要让工具来限制我们。
其实,只提供摘要的RSS也可以让用户不用再点击而直接阅读,RSS阅览器可以设计成将原始页面放到每个摘要的下面,这并没有什么技术难题,RSS阅览器现在这个不争气的模样,是RSS应用水平还不成熟的结果。
更新:欢迎大家拍砖去:点击进入本文拍砖
更新2:流水渡留言提到价值是伪问题,确实有点伪,我具体说明一下价值的含义,指现阶段一个页面的广告价值。
Web Counters51.la Free Site Stats

摘要RSS的价值》有4个想法

  1. [匿名] 赵明

    RSS在技术上不能说是复杂,目前也主要为一些网站解决了信息传输和节省编辑成本问题。

    但是,我们也发现,大量的网站都在提供RSS源,事实上只有少数几家能够作到天天更新,有些甚至几个月不更新。

    另外,RSS带给网站的信息量大规模增加,这并不是一件好事。如果作为读者每天在大量的信息中去过滤寻找自己感兴趣的东西,读者就不会喜欢这种东西。所以,RSS方便了机器阅读或聚合,但浪费了用户的时间。如,在我们的新闻聚合频道中,我常常不知道要看什么?

    http://rss.wireless3g.net

    人工干涉或整理将是今后RSS聚合的必然出路。但是,对于RSS源如何干涉或编辑就成为了一个问题。

    此外,如果我们将传统商业网站上的内容用XML格式重新编写后提交到RSS聚合,如果没有人工干预RSS将会成为另外一种垃圾内容。

    最近,发现RSS还可以把视频聚合后PUSH到手机上,看来无线RSS应用才是真正的方向。

  2. [匿名] 流水渡

    新浪或者搜狐的哪一个页面最有价值?相信大家不用太多思考就可以答复是首页.==========================================

    这个问题是伪问题。最有价值?怎么说最有价值呢。如果我关注科技,科技频道对我显然最有价值。如果我关注地产,显然地产频道对我最有价值……

    我现在进入新浪,首页对我而言,只是个入口。而且,有时,入口也不是,我直接就进入频道页了。

    呵呵。当然,这砖拍歪了。我知道醒客本文的核心意思。其实关于摘要还是全文真的不是那个好那个坏的那个有价值那个没价值的问题。关键看个人的习惯。

  3. [匿名] kevin

    醒客兄,你真能写,上千字就说了一个大家都明白的问题。要是问你一本书,是目录重要,还是正文重要,估计你也能写出不少道理来。呵呵,开个玩笑,不要介意!

发表评论