小工具      在线工具  汉语词典  dos游戏  css  js  c++  java

搜索爬行原理_如何阻止搜索引擎爬行WordPress网站

搜索引擎,java,python,linux,大数据 额外说明

收录于:15天前

搜索爬行原理

最近,我们的一位用户问我们如何阻止搜索引擎抓取和索引他们的 WordPress 网站?在很多情况下,您都希望阻止搜索引擎抓取您的网站或将其列在搜索结果中。在本文中,我们将向您展示如何阻止搜索引擎抓取 WordPress 网站。

最近,我们的一位用户问我们如何阻止搜索引擎抓取和索引 WordPress 网站?在许多情况下,您希望阻止搜索引擎抓取您的网站或将其列在搜索结果中。在本文中,我们将向您展示如何阻止搜索引擎抓取您的 WordPress 网站。

Stop search engines from crawling your WordPress site
为什么和谁想要停止搜索引擎 Why and Who Would Want to Stop Search Engines

对于大多数网站来说,搜索引擎是最大的流量来源。您可能会问,为什么有人想要阻止搜索引擎?

对于大多数网站来说,搜索引擎是最大的流量来源。您可能会问,为什么有人会屏蔽搜索引擎?

When starting out, a lot of people don’t know how to create a 本地开发环境 or 暂存站点. If you’re developing your website live on a publicly accessible 域名, then you likely don’t want Google to index your under construction or maintenance mode page.

刚开始时,很多人都不知道如何创建本地开发环境暂存地点 。 如果您要使用公开的域名来开发网站,那么您可能不希望Google为您的在建或维护模式页面编制索引。

There are also many people who use WordPress to create 私人博客, and they don’t want those indexed in search results because they’re private.

也有许多人使用WordPress创建私人博客 ,并且他们不希望将它们编入搜索结果中,因为它们是私人博客

Also some people use WordPress for 项目管理 or 内联网, and you wouldn’t want your internal documents being publicly accessible.

还有一些人使用WordPress进行项目管理内联网 ,并且您不希望内部文档可以公开访问。

在上述所有情况下,您可能不希望搜索引擎索引您的网站。

在上述所有情况下,您可能不希望搜索引擎对您的网站建立索引。

一个常见的误解是,如果我没有指向我的域的链接,那么搜索引擎可能永远不会找到我的网站。这并不完全正确。

一个常见的误解是,如果我没有指向我的域的链接,搜索引擎可能永远找不到我的网站。这并不完全正确。

搜索引擎可以通过多种方式找到链接到其他地方的网站。例如:

搜索引擎可以通过多种方式找到链接到其他地方的网站。例如:

  1. Your domain name could have been previously owned by someone else, and they still have some links pointing to your website now.

    您的域名以前可能是其他人拥有的,但他们现在仍有一些指向您网站的链接。
  2. Some domain search site’s results could get indexed with your link on them.

    某些域搜索网站的结果可能会在您的链接上被索引。
  3. There are literally thousands of pages with just list of domain names, your site can appear on one of those.

    实际上,有数千个页面仅列出了域名列表,您的网站可以显示在其中之一上。

网络上发生了很多事情,其中​​大多数都不受您的控制。但是,您的网站仍然在您的控制之下,您可以指示搜索引擎不索引或关注您的网站。

网络上发生了很多事情,其中​​大部分都超出了您的控制范围。但是,您的网站仍然在您的控制之下,您可以指示搜索引擎不要索引或关注您的网站。

影片教学 Video Tutorial

演示地址

如果您不喜欢该视频或需要更多说明,请继续阅读。

如果您不喜欢该视频或需要更多说明,请继续阅读。

阻止搜索引擎爬行和索引您的WordPress网站 Blocking Search Engines from Crawling and Indexing Your WordPress Site

WordPress comes with a built-in feature that allows you to instruct search engines not to index your site. All you need to do is visit 设置 » 阅读 and check the box next to Search Engine Visibility option.

WordPress具有内置功能,可让您指示搜索引擎不要为您的网站编制索引。 您所需要做的就是访问“设置»阅读”,然后选中“搜索引擎可见性”选项旁边的框。

Search engine visibility setting in WordPress

选中此框后,WordPress 会将此行添加到您网站的标题中:

选中此框后,WordPress 会将此行添加到您的网站标题中:

<meta name='robots' content='noindex,follow' />

WordPress also modifies your site’s 机器人.txt file and add these lines to it:

WordPress还修改了您网站的机器人.txt文件,并在其中添加了以下一些行:


User-agent: *
Disallow: /

这些行要求机器人(网络爬虫)不要为您的页面建立索引。然而,搜索引擎是否接受此请求或忽略它完全取决于搜索引擎。尽管大多数搜索引擎都尊重这一点,但您网站上的某些页面或随机图像可能会被编入索引。

这些行要求机器人(网络爬虫)不要为您的页面建立索引。然而,是否接受这个请求完全由搜索引擎决定。尽管大多数搜索引擎都尊重这一点,但您网站上的某些页面或随机图像仍可能被编入索引。

如何确保您的网站没有出现在搜索结果中? How to Make Sure Your Site Doesn’t Appear in Search Results?

默认的 WordPress 可见性设置指示搜索引擎不要为您的网站建立索引。但是,搜索引擎最终可能仍会从您的网站抓取页面、文件或图像并为其编制索引。

默认 WordPress 可见性设置指示搜索引擎不要为您的网站建立索引。但是,搜索引擎最终可能仍会对您网站上的页面、文件或图像进行爬网和索引。

确保搜索引擎根本不会索引或抓取您的网站的唯一方法是在服务器级别使用密码保护您的整个 WordPress 网站。

确保搜索引擎根本不会索引或抓取您的网站的唯一方法是在服务器级别对整个 WordPress 网站进行密码保护。

这意味着当任何人尝试访问您的网站时,甚至在访问 WordPress 之前都会要求他们提供用户名和密码。这也包括搜索引擎。登录失败后,他们会显示 401 错误,并且机器人会转身离开。以下是如何使用密码保护整个 WordPress 网站。

这意味着当任何人尝试访问您的网站时,他们在访问 WordPress 之前都会被要求输入用户名和密码。这也包括搜索引擎。登录失败后,将显示 401 错误并且机器人将关闭。这是用密码保护整个 WordPress 网站的方法。

方法1:使用cPanel密码保护整个站点 Method 1: Password Protecting an Entire Site using cPanel

If your WordPress 托管提供商 offers cPanel access to manage your hosting account, then you can protect your entire site using cPanel. All you have to do is log in to your cPanel dashboard and then click on ‘Password Protect Directories’ icon under the ‘Security’ section.

如果您的WordPress 托管提供商提供cPanel访问权限来管理您的托管帐户,那么您可以使用cPanel保护整个网站。 您要做的就是登录cPanel仪表板,然后单击“安全性”部分下的“密码保护目录”图标。

Password protect directories

接下来,您需要选择安装 WordPress 的文件夹。通常,它是 public_html 文件夹。

接下来,您需要选择安装 WordPress 的文件夹。通常,它是 public_html 文件夹。

Select the root folder

如果您在 public_html 目录下安装了多个 WordPress 站点,那么您需要单击文件夹图标来浏览并选择您想要密码保护的网站的文件夹。

如果您在 public_html 目录下安装了多个 WordPress 站点,则需要单击文件夹图标来浏览并选择要使用密码保护的站点的文件夹。

在下一个屏幕上,您需要输入受保护目录的名称,然后单击“保存”按钮。

在下一个屏幕上,您需要输入受保护目录的名称,然后单击“保存”按钮。

Enter a name for protected directory

您的信息将被保存,cPanel 将重新加载页面。之后,您需要通过输入用户名和密码来添加授权用户。

您的信息将被保存,cPanel 将重新加载页面。之后,您需要输入用户名和密码来添加授权用户。

Add authorized user

就这样,您已经成功为您的 WordPress 网站添加了密码保护。

就这样,您已经成功为您的 WordPress 网站添加了密码保护。

现在,每当用户或搜索引擎访问您的网站时,系统都会提示他们输入您之前创建的用户名和密码来查看该网站。

现在,每当用户或搜索引擎访问您的网站时,系统都会提示他们输入您之前创建的用户名和密码来查看该网站。

Password protected website
方法2:使用插件对WordPress进行密码保护 Method 2: Password Protecting WordPress with a Plugin

If you are using a WordPress 托管 solution, sometimes you don’t have access to cPanel.

如果您使用的是WordPress 托管解决方案,则有时您无权访问cPanel。

在这种情况下,您可以选择使用不同的 WordPress 插件来密码保护您的网站。以下是两种最流行的解决方案:

在这种情况下,您可以选择使用其他 WordPress 插件来密码保护您的网站。以下是两个最流行的解决方案:

  1. 种子产品 – it’s the #1 coming soon and maintenance mode plugin for WordPress, used on over 800,000+ websites. It comes with complete access control and permissions features that you can use to hide your website from everyone including search engines. We have a step by step SeedProd 操作指南.
  2. 种子产品 –这是即将推出的#1和WordPress维护模式插件,已在超过80万个网站上使用。 它具有完整的访问控制和权限功能,可用于对所有人(包括搜索引擎)隐藏您的网站。 我们对于种子产品提供了逐步指导
  3. 密码保护密码保护如何使用密码保护 WordPress 网站.如何使用密码保护 WordPress 网站步指南。

We hope this article helped you stop search engines from crawling or indexing your WordPress site. You may also want to see our ultimate step by step WordPress 安全指南 for beginners.

我们希望本文能帮助您阻止搜索引擎抓取或索引WordPress网站。 您可能还想看看我们针对初学者的终极逐步WordPress 安全指南

If you liked this article, then please subscribe to our YouTube 频道 for WordPress video tutorials. You can also find us on 推特 and Facebook.

如果您喜欢这篇文章,请订阅我们的YouTube 频道 WordPress视频教程。 您也可以在推特Facebook上找到我们。

翻译自: https://www.wpbeginner.com/beginners-guide/how-to-stop-search-engines-from-crawling-a-wordpress-site/

搜索爬行原理

. . .

相关推荐

额外说明

Springboot - 集成并使用Sigar监控CPU、内存等信息

Sigar简介 Sigar是Hyperic-hq产品的基础包,能够实现获取服务器运行时的各项状态信息,如:cpu占用率、内存使用情况等。 下载Sigar相关文件 文章末尾会给出可供下载的工具文件,以及Springboot整合使用的相关代码。 开发前的准备

额外说明

CentOS7。安装redis4.0

  # tar zxvf redis-4.0.2.tar.gz   解压后进入解压目录 # make    # make install   # ps -ef | grep redis   进行客户端 #  redis-cli         [root

额外说明

[转发]MySQL安装配置教程(超级详细、保姆级)

MySQL安装配置教程(超级详细、保姆级)_SoloVersion的博客-CSDN博客_mysql安装配置教程一、 下载MySQLMysql官网下载地址https://downloads.mysql.com/archives/installer/1. 选

额外说明

解决Unity中UI的中心锚点无法拖动修改问题(笔记)

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 解决UI的中心锚点无法拖动修改问题 一、问题状况,入下图中心锚点是灰色的,无法拖动 二、解决方法,把中心模式修改为锚点模式 总结 一、问题状况,入下图中心锚点是灰色的,无法拖动 二、解决方

额外说明

探索随机森林: 机器学习中的集成学习神器

机器学习 第七课 随机森林 概述 机器学习 机器学习的主要分类 监督学习 无监督学习 强化学习 集成学习 提高准确性 增强稳定性 提升泛化能力 集成学习的主要方法 Bagging Boosting Stacking 随机森林的理论基础 决策树的基本原理

额外说明

【Python第三方包】实现自动化(pyautogui包)

文章目录 前言 一、如何安装pyautogui 二、pyautogui鼠标操作 2.1 鼠标移动 2.2 鼠标点击 2.3 拖动鼠标 三、键盘操作 3.1 按下和释放按键 3.2 键盘输入 四、截图和图像识别 4.1 截图 4.2 图像识别 总结 前言

额外说明

JVM学习(一)使用netbeans调试Hotspot虚拟机

折腾了一天,把调试Hotspot踩过的坑分享出来,注意使用root权限,切记!!! 首先说下环境: Centos 7 ,jdk1.7u80.获取为官网,可参考此博客的获取方式: https://blog.csdn.net/weixin_39917216/

额外说明

问题随记 —— MySQL不能远程登录

文章目录 问题描述 解决方法 问题描述 MySQL 只可以在本地登录,不能进行远程登录。(又或是只可以在本地登录,不能在远程登录)。 解决方法 更改 host 为 %,并刷新权限。 use mysql; update user set host='%'

额外说明

查找wordpress端口_如何查看人们用来查找WordPress网站的关键字

查找wordpress端口 您想查看人们用来查找您的 WordPress 网站的关键字吗? 您想查看人们用来查找 WordPress 网站的关键字吗? 关键字是用户在搜索引擎中输入的短语,用于查找他们正在寻找的内容。您希望您的网站能够针对描述您所提供产品

ads via 小工具