Popular posts

2009/10/16

TAGGING THE WORLD(2):不完美及前瞻

Tagging遇到的问题

在讲到这么多的优势的同时,Tagging不可避免的也存在一些设计上的不足和缺陷。

无意义的、错误的以及不准确

社会化分类不可避免的会产生一些无意义的、错误的或者更多情况下是不准确的描述信息,而由于这些信息的自由发布和传播,一方面无意义的tag会影响信息的专业性和信任感,另一方面错误的或不准确的tag也会对用户理解信息产生干扰。

同一事物的不同描述

最明显的事例就是:对于一张美女照片,有人会以“美女”,有人会以“美人”,当然也会有人直接tagging之以“女人”,更遑论“woman”,“girl”,“female“,”beauty”之类跨文化或语言的差异性。因此当用户通过搜寻“美女”时,可能无法获取被tagging以“beauty”的信息。
这就引入了Tagging的受控词表问题,我们仍然可以通过搜索引擎的受控词表的方式来建立词汇相关性,即当用户在搜寻“美女”的时候,同时也会将“beauty”的信息返回,也即是说在通过tag来关联信息的时候,“美女”等同于“beauty”。

需要大量用户的参与

同wikipedia一样,建立一个高效、覆盖面广的tag系统需要大量用户的贡献,如何提升用户的参与性,并提供高质量的tag就是Tagging系统的大问题。

学习成本较高

与传统的分类法相比,Tagging仍然算是一个比较难以理解和使用的东西,因此大部分应用了Tagging系统的网站都在tag输入框附件提供了“标签是什么”或“如何添加适合的标签”等信息。

关于Tagging,我们看远一些…

自动化的tag生成机制

Tagging面临的一个很大难题就是如何帮助用户为信息创建有意义的tag,一般采用的引导方式是根据其他用户的标签来为用户提供候选tag列表。
qq写日志时提取频度词作为标签

智能识别与混合式Tag

尽管受控的Tagging存在着争议,但通过机器分析的方式来自动识别信息的内容仍然是一种让人欢欣鼓舞的向往。如果图像、音频和视频的智能分析能够提升效率和准确度,那么由程序来代替用户产生标签也并非不可能。
在flickr和yupoo的照片页,我们可以看到有机器读取的照片信息,包括当前照片的相机类型及EXIF信息,这些信息只是智能分析的雏形。毕竟与这些照片固有的结构化数据相比,要识别图像或音频还需要更多的技术壁垒要攻陷。

Tag API

Tagging作为一种分类法,大大提高了内容的可发现性,并发掘了内容与内容之间的相关性。但tagging在各个社会化网络中都是作为独立的体系,那么是否能够有一种机制能够在不同的网络和系统间共享tag数据,使得tag的内容索引范围更大,并且而能够通过tag来聚合各种格式的资源?

分面

尽管tag现在主要还是应用于内容的聚合或索引上,但Tagging从其实际意义而言就是为信息增加了更多维度的属性值——即为信息添加了多个分面——理所当然的tag理论上也能够建立分面搜索模型。

可视化

关于Tag的可视化研究国外已经有很多有趣的实例,下面只是列出了几个最近看到的信息可视化项目:
Tagged Colors
作者: Christian Giordano
年代: 2005
地址: http://nuthinking.com/did/tagged_colors_03/
项目描述: 这个程序呈现了词语与颜色之间的关系。通过数据库记录flickr上关于颜色群组上照片的颜色值,关键因素是的所有已注册的标记图像的颜色均匀性,对这些颜色的平均属性和标记的知名度之间的关系。
Visualizing tagging behavior in Nicovideo
作者: kynbit,Institution
年代: 2007
地址: http://www.flickr.com/photos/kynbit/sets/72157603197725957/
项目描述: 在日本, Nicovideo (日本人称这个服务为 Nico Nico Douga) 是一各与youtube类色的用户生成内容的服务。在本项目中,作者尝试通过视觉化这个协作网络上的tag来理解“nicovideo上发生了什么”。
更多的信息可视化资源请查看VisualComplexity.com

标签: ,

blog comments powered by Disqus