技术观点

加强技术投入,共享技术成果

搜索无所不在


编辑:杭州大显网络科技有限公司更新日期:2009-05-26
互联网搜索引擎的飞速发展,使得搜索已经成为人们获取信息最为简单,直接和自然的方式。在一个小方框中,键入几个字,一按回车,海量的信息瞬间就呈现在眼前,搜索,就这么简单。
在互联网工具普及之前,专业人员查询信息要先了解查询信息对象的结构,在专业的系统中,输入特定的条件,才能得出结果。现在,这种复杂的门槛已经不复存在了。搜索成为与网页浏览、邮件并列的网上前三项被最常使用的服务。
互联网搜索在带给人们便利的同时,潜移默化地改变了用户的行为习惯,从而也给整个IT技术应用带来改变。人们越需要搜索,搜索就越需要提升。搜索只是打开了通往信息世界的大门,搜索继续发展还面临很多挑战。
继续发展搜索技术
由于海量信息规模的飞速增长,搜索把越来越庞杂的信息带到人们的面前。帮助人们真正从中析取自己所关注所需要的信息,是搜索服务本质的再次回归,也是搜索技术所面临的巨大挑战。为了筛选有效和准确的信息,需要在网络内容分析、元数据建立和使用方面加强相关应用。
正确理解内容
为了获取符合用户需求的信息,并以合适优先顺序提供给用户,需要对信息内容正确地理解。目前,即使在网页搜索的范畴,以现行的网页标记和链结分析的技术的局限性日益凸现。
特别是对待日益重要的搜索引擎优化(SEO)现象,不得不以一些非技术的极端手段来处理。据报道,Google已经将其排序算法中PageRank分析的权重调整到20%以内,另80%将更加侧重内容本身分析。
笔者所在的TRS公司,一直致力于基于统计学和语义学研究成果研发文本内容分析技术并取得良好的应用效果。内容理解或者说自然语言理解是搜索技术发展的重要课题,而且,在搜索的另一端,内容理解技术应用也有助于改变目前关键字检索的单一形式,丰富辅助手段,提高检索有有效性。
建立标准元数据体系
另外,除内容分析外,对元数据—描述内容的标记将更受关注,使用越来越普遍。目前在数字图书馆领域,元数据标引是信息加工的重要环节,元数据信息也成为在信息检索和交换的重要依据。标引良好的元数据和分类体系能够提高信息搜索的准确性、有效性。
如果说早期代网站目录式的搜索引擎是对基于网站元数据和分类体系提供服务,那么将来对于网络上网页及文档形成元数据规范及网络化社群化的元数据标引维护机制,并基于这个体系提供服务,则会对于网络信息资源的定位,搜索,交换和挖掘,带来质的提升。
目前,在政府、新闻和某些行业,已经着手建立信息资源的元数据标准和目录资源体系。建立和发展基于统一和规范的元数据体系的增值搜索服务,可从另一层面将搜索结果向更准确更有价值的目标推进。
创新搜索服务
在搜索技术应用的突破以外,搜索服务的创新也是搜索继续发展的关键推动力。目前,主流搜索引擎服务仅仅局限在互联网搜索引擎方面,搜索WEB页面和文档,商务模式也以竞价排名等在线广告为主,目标对象主要是大众,这种单一服务具有很大的局限性。
不过,互联网搜索引擎服务的突出贡献,就是把搜索,作为一种信息获取的快捷方式,植入大众心中,并培养出人们的“搜索”的意识和行为习惯。
这种意识和习惯的影响,将转化为更广更深的搜索需求,使搜索会逐步扩展、渗透及深入到各个方面:在组织内部,有从网络到桌面、到企业内部乃至企业外部整个供应链上的搜索。
搜索的价值,可体现为高效率的信息共享所带来的更低运营成本、更多的商业机会或者更可控的经营风险;在外部,由面向行业或特定需求的细分搜索服务,满足以不同人群不同需求。可依托于差异化的搜索,发掘出搜索的价值,在广告营收之外,创新出付费搜索或信息交易中介的商务模式。
搜索下一步的发展,就是突破单一互联网搜索引擎的局限性,把搜索作为动词谓语,而不同的应用领域信息需求作为主语,二者相结合,创新出多维的细分的综合的搜索服务。