CDN网站加速 · alexa排名服务 · 设为首页 · 加入收藏
alexa排名优化 专业诚信的alexa排名优化服务提供商,排名真实稳定,曲线自然,助您快速提升网站影响力!让业务拓展更顺畅
首 页 alexa排名服务 alexa排名动态 alexa排名研究 互联网资讯 搜索优化SEO 网站运营推广 ITer/IT人生 联系我们
spacer
spacer
 当前位置:首  页 >> 搜索优化SEO >> 详解搜索引擎的组成部分:蜘蛛、指数、界面

详解搜索引擎的组成部分:蜘蛛、指数、界面

alexa排名优化  来源:赛迪网   时间:2009/7/10
 
zoom printer 打  印 close 评  论

  搜索引擎的历史并不长,但搜索引擎为互联网所作出的巨大贡献却显而易见,搜索引擎改变了世界,改变了用户的使用习惯,让我们对互联网的未来充满信心。

  搜索引擎起步的时候做的并不好,第一个搜索引擎甚至没有分析网页的副本,而且没有排名的标准,为了深度挖掘商业潜力,这才推动搜索引擎渐渐发展,研发更先进的系统。

  第一个比较大的商业搜索引擎是在美国的斯坦福大学,它在2001年花65亿美元购买了@主页。在开始推广的时候,最大的竞争对手是网址站,主要是因为那时候搜索结果中很多都是垃圾邮件,而且人们还不习惯用搜索引擎。

  元标记是帮助搜索引擎排序的一个工具,通常叫做关键词堆砌。一旦搜索关键词,那关键字和元标记就会告诉搜索引擎内容是在哪一页,在很短的时间做好中继标记工作,提供相关搜索结果,但随着一些企业的市场营销经验增加,他们很容易提高关键词的排名,那时候比较流行“贷款、贷款、贷款”之类的关键词堆砌,所以当时搜索引擎的垃圾信息泛滥成灾,造成许多用户的不信任感。

  那时候一些重要的搜索引擎包括:EINet银河、WebCrawler、莱科斯、Infoseek、Inktomi、Ask、AllTheWeb等。

  每一个搜索引擎都有三个主要部分组成:

  1、蜘蛛

  蜘蛛的工作职责是发现新的网页并收集这些网页的快照,然后分析该网页。

  蜘蛛以抓取页面为主,比如扫描网页,所有的搜索引擎都能够实现深层检索和快速检索。在深层检索中,蜘蛛可以查找和扫描网页内的所有内容;在快速检索中,蜘蛛不遵循深层检索的规则,只搜索重要的关键词部分,而不检查和扫描网页里的所有内容。

  大家都知道网站最重要的是快照时间,也就是说蜘蛛爬行和收录的网页速度越快,就说明这个网站在搜索引擎心中越重要,比如新华网和人民网,蜘蛛每小时爬4次以上,有的网站一个月也不见得能被蜘蛛爬一次。快照的抓取程度取决于网站内容的流行度、更新速度与网站域名的新旧。

  在蜘蛛的爬行规则中,如果有许多外部链接指向这个网站,那就说明这个网站比较重要,所以抓取这个网站的频率很高。当然,搜索引擎这样做也是为了省钱,如果都以同样的频率爬行所有网站,这样需要更多的时间和成本,才能得到更全面的搜索结果。

  2、指数

  蜘蛛在爬行的过程中,可能会重复检查网页的内容,然后查看网站内容是否是复制其他网站的,以保证网站原创内容的指数,该指数的结果一般都是基本保持复制内容的排序搜索结果。当你进行搜索时,搜索引擎不会从网络上搜索,它会从指数中选择搜索结果,所以搜索得到的网页数量并不能代表整个网站,但蜘蛛会在后台扫描和保存网站的网页数量。

  在搜索结果数量中,谷歌1-10个搜索结果约为16.05万,还有每个区域的搜索结果排名,这些都可以用搜索引擎的算法指数来控制,或者说是控制一部分。

  每个搜索引擎在全国或全世界各地都建立数据中心,当你输入需要搜索的关键词的时候,会由于数据更新的时间不同而致搜索结果同步,所以在不同的地区就会出现不同的搜索结果。

  3、Web界面

  当你使用搜索引擎所看到的界面(比如google.com、baidu.com),搜索结果取决于复杂的算法,算法都是从指数内调用结果,通过查询并分析才能在前台显示,所以算法的制作时间比较长,谷歌在这个技术领域上领先。

  还有一些搜索引擎的“一站式”特性,这类特性在英文搜索上比较常见,一般来说,搜索引擎忽略“一站式”的话,这样的搜索结果将更加正确,比如搜索“猫,狗”的时候,搜索引擎会排除“猫和狗”,只搜索“猫”“狗”。

  关键词密度是衡量一个关键词出现在网页上的频率,一般搜索引擎看到某网页上的关键词超过密度范围,那它就会分析该网页是否作弊,现在搜索引擎可以做到任何地域的字词相关度处理。所以在一般情况下,关键词应该在整个网页中分散,但一定要有某个标题或段落长期不变。

  搜索引擎还有个核心分析技术就是链接的相关性分析,除了网页排名和一般的链接,谷歌还看重锚文本链接,锚文本链接主要在于链接的年龄和位置,还有该链接的网页是否属于权威网站等。

  链接是最大的网站质量指标,搜索引擎都很关注着,因为现在友情链接比较难找,而你又很需要友情链接,所以链接中很少有垃圾信息。比如大学的网站在谷歌的权重很高,那是由于大学有很多高质量的外部链接。随着大家都了解到外部链接的重要性后,很多网站开始买卖链接,这也是现在搜索引擎比较头疼的问题,不过ask现在判定网站排名更多在于网站的质量。

  所有的搜索引擎都希望得到用户反馈的信息,他们期待在查询之前、搜索查询、时间间隔、和语义关系等方面,能更加了解到用户的意图,他们还会跟踪用户的点击,如果用户点击一个物品,然后又马上回到搜索页面,那搜索引擎就会认为这个购买不成功,会删除跟踪清单,其实这种做法已经在向电子商务靠近了。

  由此可以看出,搜索引擎已经开始注重用户体验,为了做让用户肯定自己的劳动成果,并成为搜索引擎行业的一个标准,或许未来的发展就在个性化搜索。

  Tag:详解搜索引擎的组成部分:蜘蛛、指数、界面

alexa88.com长期致力于提供专业安全的alexa排名优化服务,可让您的网站alexa排名在短期内达到目标要求,快速提升网站在业界的影响力和商业价值,满足互联网业务运营和资本运作的需求。alexa88技术实力雄厚,拥有多年的alexa排名服务经验,其间经过多次算法频繁调整的历练和服务经验的积累,我们已能快速的响应alexa排名规则的变化,并根据最新的alexa排名算法特点,调整不同数据的比例,从而确保客户网站alexa排名数据的稳定。
 
 本类最新文章
 ico 上网比过去更安全了:七成网页已  ico 人工智能成为互联网广告营销关键  ico Google旗下YouTube
 ico 搜索引擎标注新闻是真是假 假新  ico SEO网站优化  ico 2016年SEO怎么做?搜索引
 
 如果您对本文 详解搜索引擎的组成部分:蜘蛛、指数、界面 感兴趣,欢迎参与评论.
review 评论人 评论内容摘要(共 5 楼)    查看完整内容 评论时间
b 2013/3/2
b 2013/3/2
b 2013/3/29
b 2013/4/3
b 2013/4/26
欢迎您发表自己的评论。请您遵守互联网相关法律规定,
遵守网络公德,尊重他人,文明发言。
 您的姓名:
 评论正文:
 验证码:   checkcode
 
alexa排名服务
 Q    Q :736412718  
 Email :736412718#qq.com
 电   话 :15010880118
站内搜索
最新资讯推荐
羊毛党大揭秘:一亿手机黑卡在手,半
高度依赖阿里系 这到底是谁的趣店?
乔布斯的遗产,正由 Google
阿里文案门的背后:年轻人的活力与B
微信小程序, 将如何改变服装零售产
线上线下再融合,传统百货零售时代级
帮助Facebook、腾讯、阿里形
研究表明:书桌越杂乱的人,越易创立
为何苹果、谷歌和微软的欧洲总部都在
大数据时代预言家谈互联网未来
亚马逊成恐怖分子助手? “算法”模
阿里、京东、顺丰都在抢大闸蟹 背后
日本70家银行对抗支付宝 评论:B
谷歌开了个硬件发布会,却彰显了它在
Alexa前100万网站HTTPS
热门资讯列表
alexa中文网站的数据比较
七年IT奋斗纪实及感悟
改革开放30年30事:1996年编
环球企业家:百度的危与机
"21岁美女总裁"董思阳:创业英雄
百家网站集体状告百度的背后
IT牛人往事如烟之七大“先烈”篇
百度遭遇中国网络反垄断调查第一案
如何解决IE8安装ALEXA工具条
alexa发布最新工具条,全面支持
国内ALEXA排名作弊最厉害的个人
10大网络美女排行榜
Alexa排名算法调整 更适合大众
Facebook创始人华裔女友Pr
对Alexa网站访问量排名的研究报
 友情链接 >> 本站首页欢迎PAGE RANK > 1,GOOGLE / BAIDU 收录正常,ALEXA排名在20万名内站点加入链接
仪器商城 alexa排名优化
alexa排名 alexa排名动态 alexa排名研究 CDN网站加速
       
排名报价  |  alexa排名查询  |  下载中心  |  资讯列表  |  访客留言  |  联系我们  |  友情链接  |  RSS订阅
版权所有  copyright © 2004-2010  alexa排名优化专家  alexa88.com.cn
Q Q :736412718  MSN :alexa88@live.cn  Email :alexa88@163.com  电 话 :15010880118
本站所引用资讯及图片,其版权归原始所有人,转引目的仅为传播交流信息,不代表本站观点。
地址:北京市海淀区大钟寺太阳园小区12号  京ICP备09049176号