首页 SEO教程SEO运营正文

前面讲了许多关于站内优化的相关的内容,今天小编要分享的内容就是文件优化。做网站优化的人应该都知道Robots.

admin SEO运营 2019-09-28 200 0 SEO优化

前面讲了许多关于站内优化的相关的内容,今天小编要分享的内容就是文件优化。做网站优化的人应该都知道Robots.txt吧,我们可以通过它直接与搜索引擎蜘蛛对话,告诉蜘蛛哪些内容可以抓取,哪些内容不能抓取。这和我们今天要说的文件优化相关。

Robot.txt用法详解及robot.txt问题汇总 (1)为什么设置Robots.txt? 在进行SEO操作的时候,我们需要告诉搜索引擎哪些页面重要哪些页面不重要,重要的页面让蜘蛛进行抓取,不重要的页面进行屏蔽可以减少网站服务器的负担。 (2)一些常见的问题和知识点 蜘蛛在发现一个网站的时候,第一步是抓取网站的Robots.txt文件(当然官方上是这么说的,有时候也会出现不遵守的情况); 建议所有的网站都要设置Robots.txt文件,如果你认为网站上所有内容都是重要的,你可以建立一个空的robots.txt文件; (3)在robots.txt文件中设置网站地图 你可以在robots.txt中添加网站的地图,告诉蜘蛛网站地图所在的地址。 (4)Robots.txt的顺序 在蜘蛛协议中,Disallow 与 Allow是有顺序的,这是一个非常重要的问题,如果设置错误可能会导致抓取错误。 引擎蜘蛛程序会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL,一个例子可以让你更清楚明白: User-agent: * 2.Allow: /seojc/bbs 3.Disallow: /seojc/ 这个情况下,蜘蛛/seojc/bbs目录可以正常抓取,但/seojc/目录的文件无法抓取。通过这种方式可以允许蜘蛛访问特定目录中的部分url。 我们对调下位置观察一下。 User-agent: * 2.Disallow: /根目录下的文件夹/ 3.Allow: /seojc/bbs /seojc/目录出现在第一行,禁止抓取目录下的所有文件,那么第二行的Allow就无效,因为第一行中已经禁止抓取seojc目录下的所有文件,而bbs目录正好位于seowhy目录下。因此匹配不成功。 (5)Robots.txt路径问题 在蜘蛛协议中,Allow和Disallow后面可以跟两种路径形式,即绝对链接、相对链接。绝对链接就是完整的URL形式,而相对链接只针对根目录。这是重点记住。 (6)斜杠问题 Disallow: /seojc表示禁止抓取seoic这个目录下的所有文件,如:seojc.1.html、seojc/rmjc.php都不允许抓取; Disallow: /seojc/ 表示禁止抓取seojc这个目录下的文件,即允许抓取seojc.1.html,但是不允许抓取seojc/rmjc.php。 综上所述,上面就是小编要和大家分析的站内优化之文件优化,看完你是不是大吃一惊,不知道原来这其中有这么多奥妙。其实关于站内优化相关知识远不止这些,下次有机会再给你们分享点其他的。好了,今天就先给大家分享到这里。

版权声明

每天为大家转载优秀的文章,转载文章与176SEO优化博客观点无关!如果您认为本文侵犯了您的版权信息,请与我们联系修正。投诉邮箱93624862@qq.com

admin

176SEO优化博客,致力打造网络推广、
SEO优化专业团队,全心全意帮助中小企业在互联网获得超速发展。
一份不变的坚守,一份永恒的职责是我们永远的理念
网络营销培训,SEO技术教程,网站SEO优化
关注中小企业未来