搜索引擎的工作原理

更新时间: 2020-4-30 20:56 本文作者: 小强小编 所属分类: SEO知识
内容介绍

当你在搜索引擎搜索框输入搜索词,点击搜索按钮之后,不到1秒钟,就能看到成千上万个搜索结果。这到底是怎么做到的?现今我们的生活越来越离不开网络,遇到问题往往会通过搜索引擎去寻找答案,但是很多人却并不太清楚其工作原理及搜索按钮背后的秘密。本文分享:搜索引擎的工作原理

真正的搜索引擎有蜘蛛程序沿着链接爬行和抓取网上的大量页面,存进数据库,经过预处理,用户在搜索框输入查询词后,搜索引擎排序程序从数据库中挑选出符合查询词要求的页面。蜘蛛的爬行、页面的收录及排序都是自动处理的。

总结:搜索引擎的工作原理往往分为三个部分:爬行和抓取、索引、排序。

一. 爬行和抓取

1. 站长或博主或网友在网站行发布或更新内容;

2. 蜘蛛爬行

搜索引擎用来爬行和访问页面的程序被称为蜘蛛或机器人,蜘蛛每时每刻沿着链接不停地周游互联网世界的每一个角落,如果能顺利沿着链接爬行到了某一站点:

①. 会先检查该站点的(robots.txt文件),查询哪些网页可以访问,哪些网页不可以访问;

②. 如果robots协议允许蜘蛛访问,蜘蛛会从一个页面爬行到下一个页面,就好像蜘蛛在蜘蛛网上爬行那样。

3. 吸引蜘蛛

人员想要蜘蛛尽可能多的爬行和抓取页面,就要想方设法减少蜘蛛前行的阻力:

①. 页面更新度

如果网站内容经常更新,蜘蛛就会更加频繁地访问网站。

②. 导入链接

不管是外部还是内部的高质量导入链接,引导蜘蛛知道页面的存在,加快网站收录。

③. 与首页的点击距离

网站上权重最高的就是首页,蜘蛛最频繁访问的也是首页,离首页点击距离越近,页面权重就越高,被蜘蛛爬行和抓取的机会就越大。

二. 索引

蜘蛛对收集回来的网页进行检查和分析,从中提取网页信息;在经过对页面内容质量、链接质量等及一些列的算法计算后,建立一个数据索引库。

三. 排序

当用户通过搜索词查询时,搜索引擎会判断用户查询的真实意图,然后从索引数据中调取符合其搜索词的相关页面,按照相关性和重要性排序并展示这些页面。

以上,就是搜索引擎的工作原理!你看到的搜索不到1秒钟就能看到搜索结果,其实幕后是一组非常复杂的程序支持的。

 

关键词:搜索引擎的工作原理

免责声明:

本站提供的资源,都来自网络,版权争议与本站无关,所有内容及软件的文章仅限用于学习和研究目的。不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负,我们不保证内容的长久可用性,通过使用本站内容随之而来的风险与本站无关,您必须在下载后的24个小时之内,从您的电脑/手机中彻底删除上述内容。如果您喜欢该程序,请支持正版软件,购买注册,得到更好的正版服务。侵删请致信邮箱:xiaokunbug@qq.com

特别提醒:使用或测试本站软件/工具等,必须开启影子系统。点击下载影子系统

同类推荐
评论列表