关注联楷|返回首页 | 网站案例 | 帮助中心

合作共赢、快速高效、优质的网站建设提供商

上海网站建设 

服务热线:021-61394118

上海联楷科技

搜索引擎缓存和查询记录日志

作者:佚名   时间:2012-03-11   分享到:

用户搜索的关键词有很大一部分是重复的,按照二八定律,两成的搜索词占到了总搜索次数的八成,按照长尾理论,最常见的搜索词没有占到八成那么多,但通常也有一个比较粗大的头部,很少一分部搜索词占到了所有搜索次数的很大一部分,特别是有热门新闻发生时,每天可能有几百万ip来搜索完全相同的关键词,比如最近热门关键词京东商城收购一快递公司.

  搜索用户的ip地址,搜索的关键词,搜索时间,以及点击了哪些结果页面,搜索引擎都记录形成日志.这些日志文件中的数据对搜索引擎判断搜索结果质量,调整搜索算法,预期搜索趋势等都有重要意义.
 
  以前我们网站有介绍过搜索引擎的工作原理和工作过程,当然实际搜索引擎操作程序我不可能完全得知,因为其算法也是非常复杂的,



如没特殊注明,文章均为上海联楷网络原创,转载请注明来自:http://www.linksj.com/hynews/20151126/n2236.html

上海联楷网络新闻