月度归档:2006年04月

为什么播客不流行

        [[先回答一下上一篇文章后一个朋友的提问,我说“并不是所有的垂直范围加在一起就等同于通用搜索。”,他问“那为什么还要区分不同的行业做垂直搜索”?
        我的答案是,因为垂直搜索是更深入的搜索方式,非常依赖对相关行业的知识分析,也就是说只有对一个行业的资料内容做过大量的分析才能做到垂直搜索,而这种分析如果不借助人,将会是很复杂的一个过程,基于全面的内容深度搜索,还不能做到很好的效果。]]
        前阵子有人问,现在博客如此流行,下一步流行什么,是播客(podcast)吗,或者是视客(Videocast)?猛一想,似乎有些道理,即时聊天工具经历了从文字到声音、视频的变化,互联网经历了从文本到多媒体的变化,从博客到播客到视客,是最自然的延伸。
        更充分的理由在于,人们平时说话远远多于写字,写博客文章是文笔好的人专利,而说话,几乎人人可以,播客应该很快流行。
        按说,博客作为一个全新的应用模式,用户教育是个漫长的过程,从博客到播客,如果技术条件成熟,过程应该短的多,现在却出现了相反的局面,博客从2002年开始在国内兴起,到2004年木子美事件,2年时间,成蛹化蝶,而播客,从2003年开始,到如今似乎还没有化蝶的迹象。
        这当中有一些环境方面的限制,当前带宽相对还不是很高,播客的效果会有些影响,但我总觉得这不是主要原因,播客没有如约流行,应该有其他的理由。
        即时聊天工具,最开始是熟悉的朋友取代电话来使用,便宜、方便,很快即时聊天工具变成陌生人交友的工具,陌生人聊天和朋友聊天,看上去只是对象的不同,实际上却有重要的区别。
        不想做过深入的探讨,只要看一些简单的比较,比如:与朋友聊天,聊天内容常常不能随便的转到另一个朋友的身上,而陌生人聊天,除了性别还比较敏感外,可以很容易转移。再比如:朋友之间的聊天常常需要达成某种目标,而陌生人聊天常常是随意的。
        这些区别会导致服务开展的不同,QQ可以查找在线的陌生人,MSN需要按照注册邮箱来添加,我能很方便对MSN好友进行分组,而QQ,尝试很多次,发现很难,QQ上充满了不熟悉的所谓网友,除了他现在的昵称,我几乎一无所知。我能把QQ上的这些幽灵变成MSN的好友吗?非常难,因为他们是不同的。
        博客常被人们说成是圈子的交流工具,而实际上,当前博客更多充当了可以自由申请的个人专栏,不管文笔如何,作者们更多的是用来写文章表达观点,而不是象给别人写邮件那样的沟通,因此博客虽说是交流工具,而交流却非常的正式,象大酒店里专家们举行的论坛而不是街头巷尾妇人的咬耳朵。
        好了,我们再回到播客,和博客对应于自由申请的专栏相比,播客应该是什么?对,播客应该是可以自由申请的个人电台,与每个人都会写字,但不是每个人都能经常写文章一样,每个人都会说话,但不是每个人都能做电台播音员。比较一下会写字的人能写文章的比例和会说话的人能作主持人的比例,播客为什么不流行应该比较好解释。
        未来基于视音频的工具将比写字的工具更流行,但他的名字或许不叫播客。

垂直搜索与搜索趋势

当前的搜索引擎越来越不适应互联网信息检索的需要,数以万计的查询结果,看上去很好,想找到合适的结果,却比较难,搜索引擎提供的信息秩序,并不能满足互联网发展的要求。
周六第三期项目秀的时候,搜what网站提供了一种与google、百度等通用搜索不同的检索方案,搜what提供了基于黄页、航班查询、祝福语、歌曲、绿色食品等查询服务。
这通常叫做垂直搜索,搜what提供的是垂直搜索的技术引擎。垂直搜索与通用搜索相比,最大的区别是垂直搜索限制了搜索范围,不过,并不是所有的垂直范围加在一起就等同于通用搜索。
我和世纪互联CTO老蒋探讨本地搜索和网络搜索问题的时候,共识是,本地搜索并不是网络搜索的简单延伸,本地搜索更多是你已知(或者应该知道)的搜索,网络搜索更多是对未知的搜索。
传统的基于文本比对的搜索,正在进一步深入发展,整体上说,涉及到如下几大方面。
搜索对象的变化,松散文本到数据结构化。举个例子说,假如你正在查询航班,你输入“上海”的时候,结果不会是“说上海话”中的“上海”,系统知道寻找地址而不是其他,这时候,航班信息中的地址信息(如:上海)转移到别的地方将不再具有相同的含义,这是数据结构化,其含义不仅由文本,而且与所处位置相关。
搜索方法的变化,从文本比较到含义(语义)检索。搜索不再是简单的文本比对,而是基于文本真实含义的理解,例如:通常检索“牛”的时候,天牛的“牛”还是蜗牛的“牛”,都是潜在的匹配目标,这是根据文本信息比对的结果,如果引入“牛”含义,那么“蜗牛”就会排斥在外,同时,有“最重要的农耕动物”意思而不包含“牛”的内容也将是待选目标。
搜索主体相关,结果只是关于搜索者的信息。这一点尤为重要,在互联网传媒时期,传播的是公众信息,这些信息与具体人的关联性不大,比如:本届奥运会的赛程,谁是国家足球队教练。还包括公共的知识体系,比如:牛顿定律,互联网的TCP/IP协议。
越来越多的非公众信息与公共知识体系的内容出现在互联网上。昨天晚上饭店的订餐单,前天下午去浦东机场的保险单号码,一个新开张的互联网公司开发的一套公司软件协议,这些信息如果不和具体人相关,无法想象我们将怎么淹没在信息的海洋中,鼓吹搜索结果一万甚至一百万显然是个黑色幽默。
与其说搜索垂直化,还不如说搜索的纵深化,当前,机器智能的发展离人们使用目标有比较大的差距,搜索引擎技术近期的根本在于,如何利用阶段性的成果,设计出可应用的产品和服务。
51.la Free Site Stats
搜索未来到底沿着什么样的方向,非常的不确定,确定的是,搜索的未来在于越来越精确。
Web Counters
当前的搜索引擎越来越不适应互联网信息检索的需要,数以万计的查询结果,看上去很好,想找到合适的结果,却比较难,搜索引擎提供的信息秩序,并不能满足互联网发展的要求。
周六第三期项目秀的时候,搜what网站提供了一种与google、百度等通用搜索不同的检索方案,搜what提供了基于黄页、航班查询、祝福语、歌曲、绿色食品等查询服务。
这通常叫做垂直搜索,搜what提供的是垂直搜索的技术引擎。垂直搜索与通用搜索相比,最大的区别是垂直搜索限制了搜索范围,不过,并不是所有的垂直范围加在一起就等同于通用搜索。
我和世纪互联CTO老蒋探讨本地搜索和网络搜索问题的时候,共识是,本地搜索并不是网络搜索的简单延伸,本地搜索更多是你已知(或者应该知道)的搜索,网络搜索更多是对未知的搜索。
传统的基于文本比对的搜索,正在进一步深入发展,整体上说,涉及到如下几大方面。
搜索对象的变化,松散文本到数据结构化。举个例子说,假如你正在查询航班,你输入“上海”的时候,结果不会是“说上海话”中的“上海”,系统知道寻找地址而不是其他,这时候,航班信息中的地址信息(如:上海)转移到别的地方将不再具有相同的含义,这是数据结构化,其含义不仅由文本,而且与所处位置相关。
搜索方法的变化,从文本比较到含义(语义)检索。搜索不再是简单的文本比对,而是基于文本真实含义的理解,例如:通常检索“牛”的时候,天牛的“牛”还是蜗牛的“牛”,都是潜在的匹配目标,这是根据文本信息比对的结果,如果引入“牛”含义,那么“蜗牛”就会排斥在外,同时,有“最重要的农耕动物”意思而不包含“牛”的内容也将是待选目标。
搜索主体相关,结果只是关于搜索者的信息。这一点尤为重要,

互联网动力学模型

近年来,互联网重新成为热门话题,促进了关于互联网价值模型的探索,2004年,Tim O’Lary先生初次提出了web2.0的概念,这一概念在一年之内迅速在全世界范围内得到广泛的传播,掀起了一股web2.0的讨论热潮。
去年开始,web2.0也开始在中国、日本、台湾等亚洲国家和地区流行,对于web2.0,不同的人群有非常不同的观点,由于目前对于web2.0系统性的探讨比较少,一些争议常常陷入盲人摸象的境地。
随着对web2.0探讨的越来越多,容易发现,web2.0是web的深化,而不是与此前的web(也有人相应的称为web1.0,下面也称作web1.0)不一样的东西。在去年,随着门户博客潮流的爆发,创业者们不得不对web2.0作重新认识,以前对于web2.0与web1.0的界限显然被夸大了太多。
一个从历史沿革的角度对互联网进行阐释的体系模型显得非常必要,它不仅仅反映当前web2.0的一些趋势,而且能够描述互联网整体的商业价值结构,人们通过这个模型能够系统地找到互联网发展的脉络。
所谓动力学模型,是指从驱动力角度而不是现象角度来探讨,无论是技术驱动力还是用户需求的驱动力,动力学特征决定了中长期发展的方向。
互联网的发展告诉我们,所有的理论探讨,都是后验的,理论家的预言永远要落后于实践者的脚步,因此当前(包括本文)与其说是互联网方向的探讨,还不如说是对当前互联网已有事件的总结,希望总结能够帮助梳理稍显凌乱的思绪。
鉴于web2.0是web1.0自然发展的理解,在接下来的讨论中,如果没有必要,你将看不到对于web2.0与web1.0的分割。
互联网自发展以来,就担负着传播商业价值的责任,其商业价值体系可以用下面的金字塔来描述:

互联网金字塔架构

互联网是人传递信息,并由此衍生各种关系,从而实现价值的系统。毫无疑问,互联网的动力学基础是人、信息以及人与信息构成的各种关系,互联网的目标是要实现价值。
进一步解释如下:
价值(Value):互联网的商业根本。从商业角度讲,互联网上所有的行为都是为商业价值服务的,因此,一切互联网形态最终成为价值的承载体,价值成为互联网金字塔的制高点。
信息(Information):互联网传递的内容。
人(Person):互联网参与主体。作为价值诉求者的人,是互联网的活跃因素。
关系(Relationship):信息与人存在的直接或者间接的关联。关系的存在是的互联网的价值不能简单地表现为信息或者人的数量,随着互联网的发展,价值越来越体现在关系构建的结构上,关系不仅仅存在于人与人之间,也广泛的存在于信息与信息之间,信息与人之间。
价值是统领,信息、人和关系是承载者,最终,信息、人、关系、价值构成动力金字塔。但这些还不足以构成完整的,上面的描述是基于使用者的外部特征,没有给出系统的运作机制,进一步完善此模型,扩充如下:

互联网金字塔模型

业务模型(Business Model):互联网业务机制。四大元素价值、信息、人、关系在互联网上的具体呈现形式,是实现四大元素的承载体。
技术(Technology):业务模型的执行机构。互联网业务动力核心,是最终的运转机制。
至此,给出了互联网动力学金字塔模型,未来的探讨我们发现,许许多多已经出现和即将出现的现象,能够给出合理的预测、解释和方案,欢迎各位探讨。

搜索之惑

上次探讨为什么是搜索的时候说到,搜索引擎的真正价值在于提供了信息的秩序,有些朋友进一步问我,什么是信息的秩序呢?
回答什么是信息的秩序之前,先看另一个话题,当我们给小孩子刚够吃或者不够吃数量的苹果时,你会发现小孩子会不区分大小,全部吃掉,当你给的数量很多的时候,小孩子将会挑大的、好的先吃掉,如果孩子的辨别力足够,剩下来相对于已经吃掉的苹果,质量要差,这就是秩序表现。
供给小于需求的时候,人们关注生产的数量,当供给大于需求的时候,人们更关注质量,这里的质量可以通过秩序来实现。
信息的秩序可以描述成按照某个人或者某群人的需求对信息进行的组织。搜索引擎按照关键字组织信息,相对于各个服务器上的分散信息,是更符合用户需要的信息秩序。
理想的信息秩序应该满足几个条件:覆盖潜在的所有相关信息,按照符合要求的程度排序,最小数量。搜索引擎正为此而努力,蜘蛛或者机器人自动抓取网页,满足覆盖性;对页面进行评估(如:page rank页面等级),满足排序;过滤垃圾信息,分页编排,满足最小量。
不过,搜索引擎实际能做到的程度非常有限,打开搜索引擎,你输入你的关键字(不是问题),并不是搜索你的答案,而是陈列包含有答案字符的结果,除了公众流行信息,搜索引擎难以给你带来任何有意义的结果。
哥哥和弟弟向妈妈告别,“我要上学了”,同一句话,妈妈知道,哥哥去的是中学,弟弟去的是小学,但搜索引擎不知道。妈妈有关于孩子个人背景知识,而搜索引擎没有,这是很重要的区别,我曾说,网络是失忆的病人,每次与你相对,总是从你的名字问起。
学生时代,我们最有效的获取答案的方式是问老师,你一个问题,老师给出一个结果,合格的老师会让你无惑,现在我们把依靠转给搜索引擎,这是个还不够负责的老师,他告诉你可能是1,可能是2,可能是…n
并不是所有提供了秩序的工具和服务都能流行,只有这种秩序具有一定领域的应用价值,并没有更优秀的替代品才行,传统的门户首页秩序实现了新闻传播价值,但不能有效传递交流类的信息;RSS定制秩序实现了博客摘要的定向传播价值,但无法解决信息过载问题;搜索引擎的大众信息的分类(按照关键字)秩序实现公共信息检索价值,但不能解决细分信息检索价值。
很多时候,不知道目标的关键字,还需要结果,甚至是精确的结果,就像老师回答问题一样,搜索引擎可以吗?

为什么是搜索

        上帝说需要信息,于是有了互联网,上帝说需要秩序,于是有了搜索。
        说到搜索引擎(google把这个关键字第一个位置给了百度,有意思),我第一想到的是目录,无论你是想了解一本新书的内容,或者在一本看过的书中找一个遗忘的公式,翻看目录都是一个不错的选择,目录是一种信息查找的索引,通过检索比目标少得多的信息找到你想要的目标。
        搜索引擎具有和目录类似的功能,也有很大的不同,比如:由于互联网的动态性,搜索引擎提供的索引是动态、非完全、滞后、甚至错误的,尽管如此,搜索引擎目前已经成为信息索引最优秀的工具。
        操作引擎真正变得流行,还是近几年的事情,看看不管是先起的百度还是后起的搜狗,起个大早赶个晚集的雅虎,还是风华正茂的google,大有一番“搜场风云,舍我其谁”的姿态,搜索很火了。
        搜索需要较高的技术支撑,对于华尔街技术加团队的评判方式,是难得投资题材,但这并不是搜索引擎流行的原因。真正的理由在于,每天打开浏览器,除了固定的几个网址,如果你想找一些你感兴趣的信息,搜索引擎几乎是唯一选择。
        在互联网初期,信息提供者比较少,几个网站挨个看过去并不是什么问题,随着信息量的增加,地毯式的方法已经成为不可能事件,为日渐增多的信息提供索引成为必要。
        早期的互联网提供了类似图书馆检索的目录服务,但目录服务并没有成为主流的互联网服务。九十年代,雅虎开始提供分类为特点的信息索引服务,随着信息量的快速增长,基于人工分类的信息索引服务难以满足用户需要。
        通过搜索引擎,用户得到与关键词匹配的信息,与分类相比,具有更大的方便性和灵活性,而且信息是服务器从各个网站自动抓过来的(蜘蛛或者机器人),效率比人工要高很多,在海量的互联网信息中,搜索引擎成为导航者。
         农耕时代是自给自足的自然经济,工业文明带来的社会大分工,生产和流通成为不同的产业。信息产业也正在经历这样的过程,信息的生产(创作)与传播正在分离,信息越来越海量,如何保证信息流向(传播到)正确的地方也越来越重要。
         也正如计算机发展,初期是保证更高的效率和功能,逐渐变为保证安全和可靠。信息从广泛传播正在转向准确传播,信息需要秩序,保证信息的按照正确的渠道流通的秩序,这是信息的价值所在。
         搜索引擎的真正价值在于提供了信息秩序,但搜索引擎显然不是秩序的终极提供者,对于传播秩序的建立并不完善,当翻过检索结果多页也找不到自己想要到信息时,搜索引擎已经走到了边缘。
        毫无疑问,2006年最值钱的是什么,是搜索。那2006年之后呢?