Discuz! Board

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 219|回复: 0

并请您亲自对您的网站进行测试抓取

[复制链接]

2

主题

2

帖子

8

积分

新手上路

积分
8
发表于 2023-10-29 12:57:20 | 显示全部楼层 |阅读模式
可追溯 我相信你明白索引的概念,对吧? 但当我们谈论您的网站出现在 Google 上时,还有另一点。 这一点就是可追溯性(爬行)。 建立两件事之间的联系: 将您的网站纳入索引是一回事; 他是可找到的(可追踪的)是另一回事。 请理解一点:如果 Google 机器人找不到您的网页,它就无法将您的内容放入搜索结果中。 这并不意味着您的网站不会出现在 Google 上。是的,他可能在那里。 但是,如果不被抓取,您的内容将不会更新,并且您的网站将失去出现在顶部位置的潜力。

页面状态 稍微技术一下,当某人(机器人或人)尝试访问页面时,服务器会返回状态代码。 该代码定义了页面的状态。 最常见的是: 200:页面ok(可查找、可追踪); 301:页面重定向; 400:服务器错误; 500:网站错误; 404页面不存在。 这是否意味 西班牙 WhatsApp 号码数据 着您的所有页面都需要返回代码 200?不。 当您更改页面地址( 301 重定向)时,301 代码很常见。所以有这种行为是很正常的。 404虽然看起来很糟糕,但也很正常。如果您的公司不再拥有该产品或不再希望提供内容,则事实是该页面不再存在。 我们为什么要谈论这个? 因为我会再次请求您耐心等待,并请您亲自对您的网站进行测试抓取。



测试可追溯性 再次打开 Screaming Frog 并让您的网站运行。 现在寻找“响应代码”选项卡,如下所示: 尖叫青蛙 - 可追溯性 在“状态代码”栏中,您可以看到我们提到的代码:200、301、404等。 这里你要分析什么? 您有多少个“正常”页面? 你有多少个404页面? 页面状态有意义吗?或者他应该是其他人? 代码为 200 的页面与用户相关吗? 此分析可以帮助您识别常见问题: 301 定位过多; 不相关的 301 重定向(不相关的页面相互定向); 代码为 200 的页面应该处于离线状态; 第404页应该播出; 网站和服务器错误(400 和 500); 被 robots.txt 阻止的页面。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Discuz! X

GMT+8, 2024-9-22 03:52 , Processed in 0.015625 second(s), 18 queries .

Powered by Discuz! X3.5

Copyright © 2001-2022 Tencent Cloud.

快速回复 返回顶部 返回列表