高端网站建设
一切对设计、交互、功能有要求,质量有要求,细节有要求的网站,即为高端网站。

robots.txt的坑!!!!一定要注意!

2024-08-18
376

为什么新网站上线了好几个星期怎么一个页面都没收录?可能是这个文件在搞鬼!


想必我们都了解robots.txt ,是一个简单的文本文件,位于网站的根目录下,用于告诉搜索引擎的爬虫哪些页面或文件可以被访问,哪些不能被访问。它是搜索引擎优化(SEO)中不可或缺的一部分,通过合理配置robots.txt,可以有效控制爬虫的行为,从而优化网站的索引过程。


若想多了解robots.txt 可移步至下方链接:

站管理员必备指南:揭秘robots.txt的秘密



其中这个配置:

User-agent: 
Disallow:

User-agent是指定那个爬虫来爬取你的网址,Disallow则是指定那些网页不被爬取


如果你在不清楚的情况下,做了seo的robots.txt 配置优化  一定慎重的使用这个配置 因为Disallow一但设置,待网站上线之后您会发现为什么我的网站无论是代码架构,还是响应速度或者是内容质量等等都是最优最适合收录的但是 就是一直不收录,就是因为您设置了这个配置Disallow


Disallow设置后爬虫将不会再爬取您的网站,我们做了网站就是为了收录为了能够被看到,所以说这个就是有点背道而驰了,所以当我们配置robots.txt时一定要注意使用Disallow,一般为了收录都会设置Allow 他与Disallow正好相反,他则是允许访问那些页面,也就是允许爬虫爬取那些页面。


但是如果前期没有注意,从网上随便搞了个robots.txt恰巧 设置了Disallow怎么办呢? 这就需要赶快通知我们的运维同学赶紧设置为Allow,并且还需要继续做一些适合收录的优化,像是发布一些高质量的文章等,等待网站爬虫后期发现我们的网站,若还是长期没有效果还是不收录的话,就需要找一些专业的SEO优化人员来帮助我们的网站收录。


一般来说网站不需要配置robots.txt 文件,因为没有这个文件网站收录也不会受影响,这个文件只是为了更好的优化,只要你网站质量够好,待上线之后一般7-15 天您的网站就会被收录。


以上就是再做SEO优化robots.txt 的一个坑,若您想要一些专业的网站支持,风涯轻舟👋 可以作为您选择的对象,我们有专业的优化师,也有专业的网站建设团队,期待与您的合作!


风涯轻舟,专业照顾您的业务目标!

合作咨询