Popular posts

2009/10/16

TAGGING THE WORLD(1):社会化的信息分类


TAGGING是一种社会化的应对大量信息的分类法。TAG作为信息的附加元数据(metadata)为信息提供了附加的或补充的信息,能够弥补传统层级结构在信息筛选上的不足,提供搜寻信息的更多维度,并且更重要的是,通过tag能够帮助系统实现信息的跨纬度相关性分析。

社会化

Tagging作为一种模式,首先是由信息的浏览者或使用者(而非设计者)来添加信息的分词描述,借以管理其信息,或分享给其他用户查看和再次使用(reuse)。
这就有别于传统的层级分类结构,层级结构在处理少量的数据时具有相当多的优势。信息架构的专家或行业的资深人士能够从经验出发,选择适当的维度来对信息进行整理和分类,能够帮助用户快速筛选信息,并且也更符合用户在其他领域搜寻信息的思维模型。

而Tagging则是由用户来参与分类设计,尽管用户并不能直接意识到自己是在参与分类过程,但在客观上仍然是一种社会行为。当有足够多的用户参与这种社会行为,那么就能够根据获得tag数据来提供与层级分类截然不同的信息检索方式。
从这个角度而言,Tag模式与wikipedia的模式有异曲同工之妙;通过多人协作的方式来完成信息的准确标注

大量信息

如上面提到,当信息量较少或并不复杂时,信息的层级分类足以满足搜寻的需要,则无需采用Tagging,因为这将使得信息的组织更加复杂,尤其是当分类和tagging同时存在时,用户对于类别和tag会产生理解上的障碍,而并不能有效提升信息的可发现性。
而对于存储和提供大量信息的服务,如flickr、amazon等,层级分类法无法帮助用户准确定位信息,分类也无法完整传达信息本身的分面(facet),那么引入tagging,由用户贡献对于分面信息的描述,这就为信息补充了相应的元数据(metadata)。如Tagging系统能由用户提供一张照片的拍摄地点、时间、相机型号等信息,这些信息往往是层级分类法所无法覆盖的。

分类法

Tagging仍然是一种分类法,因为其本质仍然是对于信息的分类索引
层级分类法的瓶颈在于专家的分类法并不能完全匹配用户对于信息的认知和理解,对于信息的理解不同,而导致不同用户对于同一样事物的有着不同的指代词。
在现实的小书店,我们往往是通过文学艺术、科学技术、医药健康等等分类来组织书籍的排放位置,尽管这种方式低效,但的确符合顾客的认知模型,顾客也能够据此来查找相应的类别。
但当我们面对图书馆级别的数据库时,层级分类结构的局限性就显露无疑了。当我在浩如烟海的图书馆里找《钢铁是怎样炼成的》,我是要找“工业原材料”,还是“文学艺术”,还是“参考手册”,抑或“成功励志”?
另一方面,大量的信息本身也是比较复杂的,很难将之划分到相应的领域,有过类目设计的同学应该对此感同身受。
Tagging则从另一个角度重新设计了信息的分类模式,tag本身是分散和无层级的,因此任何一个tag从本质而言都是一种分类模式,唯一的区别在于层级分类是先定义篮子,然后往篮子里放不同的水果,而Tagging则是将每一个水果系上一个或多个tag,这样就产生了一种充斥交集和关系的tag链,当我们以为这只是产生了更多的混乱的时候,我们发现当提起一个tag的时候,相应的水果都被我们找到了。这种方式不仅解决了信息难以分类的问题,也更方便用户建立不同信息的联系。

Tagging的类型

自由的tagging

在多数web2.0网站的tagging系统中tag的实现仍然由用户贡献的,如果flickr、delicious等,用户对于非受限信息都能够自由的tagging,通过大量的数据积累而使得通过tag库组织内容成为可能。 比如flickr和delicious已经能够通过tag的搜索进行信息的搜寻。


受控的(引导式)tagging

受控是指tag并非完全由用户提供,而是由系统提供相应的词表来提供预设,或推荐用户进行选择,当然在大多数情况下用户仍然是可以自行修改。但基于“多数用户是喜欢偷懒的”的假设,若非必要用户一般不会修改预设的信息,这时信息的tagging对于用户是比较简单的,但是产生的tags是否有意义就是一个问题了。
如QQ空间的日志发布页面,tag由程序根据用户的日志内容自动匹配受控词表,或遍历出现频度较高的单词作为推介的标签。这种方式固然有一定的算法依据,也的确大大降低了用户tagging的难度,但自动生成是否能够替代用户的词汇,并且这是否也造成tag词库倾向于系统的识别,而不依赖于用户的认知?

优势

在讨论Tagging的优势前,我们首先需要明确的是Tagging并非是层级分类的替代方案,他们只是是分类法的两种不同模式。在不同的用户、内容和情境下,采取不同的信息架构策略,则可以选择两种模式之一或者两者兼而有之。
  • 弥补专家(层级)分类法的不足
  • 还原用户的实际理解与认知
  • 无限的扩展性,以及较少的运维成本

标签: ,

blog comments powered by Disqus