2020年,你需要一个全网通用的网站平台

汶上小程序开发分享如何创建XML站点地图(并将其提交给Google)

编辑:汶上新城建站 关注: 时间:2019-12-09 11:12:36


温馨提示:专业网站建设、小程序制作、APP开发,尽在新城建站,详询 15544599750(手机、微信、QQ同号)

如何创建XML站点地图(并将其提交给Google)

正如在没有地图的情况下很难找到新的目的地一样,对于Google而言,有时在没有站点地图的情况下很难找到您网站上的所有页面。

幸运的是,创建XML站点地图并将其提交给Google既快捷又容易。

下面,我们逐步介绍如何执行此操作。

但首先,让我们介绍一些基本知识。

(已经知道基本知识了吗?单击可直接跳转至创建站点地图。)

什么是站点地图?

站点地图是一个XML文件,列出了您网站上的所有重要内容。您要在搜索引擎中显示的任何页面或文件都应在站点地图中。

有趣的事实

Sitemaps列出的网址不能超过50,000个,并且网址大小不能超过50mb。如果您的站点地图超过一个或多个这些数字,那么您将需要创建多个。

这是什么一个XML网站地图是什么样子?

XML网站地图是为搜索引擎而不是人类制作的。如果您以前从未看过它们,它们可能看起来有些令人生畏。

<?xml版本=“ 1.0”编码=“ UTF-8”?>

<urlset xmlns =“ http://www.sitemaps.org/schemas/sitemap/0.9”>

<url>

<loc> https://ahrefs.com/ </ loc>

<lastmod> 2019-08-21T16:12:20 + 03:00 </ lastmod>

</ url>

<url>

<loc> https://ahrefs.com.com/blog/ </ loc>

<lastmod> 2019-07-31T07:56:12 + 03:00 </ lastmod>

</ url>

</ urlset>

让我们分解一下。

XML声明

<?xml版本=“ 1.0”编码=“ UTF-8”?>

这告诉搜索引擎他们正在读取XML文件。它还说明了使用的XML版本和字符编码。对于站点地图,版本应 为1.0,编码必须 为UTF -8。

网址集

<urlset xmlns =“ http://www.sitemaps.org/schemas/sitemap/0.9”>

这是站点地图中所有URL的容器。它还告诉搜寻器使用了哪种协议标准。大多数站点地图都指定了Sitemap 0.90标准,Google,Yahoo!和Microsoft等公司都支持该标准。

网址

<url>

<loc> https://ahrefs.com/ </ loc>

<lastmod> 2019-08-21T16:12:20 + 03:00 </ lastmod>

</ url>

这是每个URL的父标记。您必须在嵌套 标记中指定URL的位置<loc>。至关重要的是,这些必须是绝对的而非相对的规范URL。

尽管这是这里唯一需要的标记,但是有一些可选属性:

<lastmod>:指定上次修改文件的日期。该 格式必须为W3C日期时间格式。例如,如果您在2019年9月25日更新了帖子,则该属性将显示为2019-09-25。您还可以包括时间,但这是可选的。

<priority>:指定URL相对于网站上所有其他URL 的优先级。值的范围是0.0到1.0。更高更重要。

<changefreq>:指定页面更改的频率。它的工作是让搜索引擎了解他们可能希望重新抓取URL的频率。有效值始终是,每小时,每天,每周,每月,每年和从不。

这些可选的标签都不是那个 重要的搜索引擎优化。

对于 <lastmod>,Google的Gary Ilyes 指出 ,在大多数情况下,他们会忽略它,因为“网站管理员在确保准确性方面做得很糟糕。”由于大多数站点地图生成器都将其设置为所有页面的当前日期,而不是文件的上次修改日期,很容易明白原因。

对于 <priority>,谷歌表示 他们忽略了这个标签,因为它只是一个“杂音袋”。

对于 <changefreq>,约翰·穆勒( John Mueller)说: “优先级和变更频率在Sitemaps中实际上不再扮演那么重要的角色。”

为什么需要站点地图?

Google通过爬网发现新内容。爬网页面时,他们会同时注意页面上的内部和外部链接。如果发现的URL不在其搜索索引中,则他们可以解析其内容并在适当的地方对其进行索引。

但是Google无法以这种方式找到所有内容。如果未从其他已知页面链接到某个网页,则他们将找不到该网页。

这是站点地图的来源。

站点地图告诉Google(和其他搜索引擎)在哪里可以找到您网站上最重要的页面,以便它们可以对其进行爬网和编制索引。

这很重要,因为搜索引擎必须先将内容编入索引才能对您的内容进行排名。

如何创建站点地图

一些CMS会为您生成一个站点地图。当您在网站中添加或删除页面和帖子时,这些信息会自动更新。如果您的CMS不这样做,那么通常会有一个可用的插件。

在WordPress中创建站点地图

即使WordPress 支持34.5%的网站,它也不会为您生成站点地图。要创建一个,您需要使用 Yoast SEO之类的插件。

要安装Yoast SEO,请登录到WordPress仪表板。

转到插件>添加新内容。

添加新的插件wordpress 3

搜索“ Yoast SEO”。

在第一个结果上点击“立即安装”,然后点击“激活”。

酵母seo搜索3

转到SEO >常规>功能。确保“ XML网站地图”切换开关处于打开状态。

xml网站地图yoast 3

现在,您应该在yourdomain.com/sitemap.xml或yourdomain.com/sitemap_index.xml上看到站点地图(或站点地图索引)。

ahrefs网站地图3

边注。 如果您的WordPress安装位于子文件夹或子域中,则您的站点地图位于该路径下。例如,可以通过ahrefs.com/blog/sitemap_index.xml访问我们博客的站点地图。

小费

如果您要专门从站点地图中包含或排除某些类型的内容(标签页面,类别页面等),请转到“搜索外观”设置。

类别页面不包括酵母3

您也可以从编辑器的“高级”元框中排除单个帖子或页面。

yoast noindex发布3

重要提示。仅从站点地图中排除您不想显示在搜索结果中的页面。

在我们的WordPress SEO指南中了解更多信息。

在Wix中创建站点地图

Wix会自动为您创建一个站点地图。您可以在yourwixsite.com/sitemap.xml上找到它。

不幸的是,您对站点地图中包含或不包含的页面没有太多控制。如果要排除某个页面,请转到该页面的“ SEO(Google)”设置标签,然后关闭“在搜索结果中显示此页面”。

wix noindex 3

请注意,这还会在页面上添加noindex元标记,从而将其排除在搜索结果之外。

边注。 如果您可以在Wix中规范化URL,则不会将其从站点地图中删除。虽然这可能不会影响大多数用户,但是请注意,将规范化页面包含在站点地图中并不是最佳做法,它可能会向Google发送混合信号。

在Squarespace中创建站点地图

Squarespace还会自动为您创建一个站点地图。通常,您可以找到yoursquarespacesite.com/sitemap.xml。

尽管可以在“ SEO ”标签中从搜索引擎中排除(无索引)页面,但是无法在Squarespace中手动编辑站点地图。

seo方形空间3

这也会将该页面从您的站点地图中排除。

在Shopify中创建站点地图

Shopify会自动为您生成一个站点地图。在yourstore.com/sitemap.xml上找到它。

不幸的是,在Shopify中没有简单的方法无法对页面进行索引。您必须直接在.liquid文件中编辑代码。

创建不带CMS的站点地图

如果您认为网站上的页面少于300页,请安装免费版本的Screaming Frog。

安装完成后,进入“ 模式”>“蜘蛛”。

将您的主页URL粘贴到标有“输入蜘蛛的URL ”的框中。

点击“开始”。

尖叫青蛙Sitemap 3

边注。 确保使用 主页的规范(主)版本。如果您不这样做,Screaming Frog将只抓取一个URL。

搜寻完成后,请查看右下角。

它会说像这样:

SF总刮擦3

如果数字是499或更低,请转到Sitemaps> XML sitemap。

由于Google对<lastmod>,<changefreq>和不太关注<priority>,因此建议您将它们从站点地图文件中排除。

尖叫青蛙的站点地图设置3

点击“下一步”并将站点地图保存到您的计算机。做完了

如果数字显示“ 500之500”,则导出站点地图毫无意义。为什么?因为这意味着您在爬网站点上的所有页面之前已经达到爬网限制。结果,导出的站点地图可能会丢失数百个页面,这使其变得毫无用处。

解决此问题的一种方法是搜索免费的站点地图创建者。有很多。

不幸的是,大多数都不可靠。

我们测试了一些最受欢迎的生成器,发现相当多的生成器包括非规范的URL,无索引的页面和重定向。这是不好的SEO做法。

发电机 包括规范化的URL? 包括没有索引的URL? 包括重定向?

xml-sitemaps.com 是的? 不? 不?

web-site-map.com 是的? 不? 不?

xmlsitemapgenerator.org 是的? 不? 不?

smallseotools.com/xml-sitemap-generator 是的? 是的? 是的?

freesitemapgenerator.com 是的? 是的? 是的?

duplichecker.com/xml-sitemap-generator.php 是的? 是的? 是的?

xsitemap.com 是的? 是的? 是的?

那么解决方案是什么?

如果Screaming Frog无法抓取您的整个网站,请使用Ahrefs Site Audit来抓取您的网站。

边注。 验证您的网站以加快抓取速度。就是这样。

搜寻完成后,请转到数据资源管理器并添加这些过滤器。

现场审核自定义设置3

点击导出 > 当前表视图。

打开CSV文件,然后将URL列中的所有URL复制并粘贴到此工具中。

点击“添加到队列”,然后点击“将队列导出为sitemap.xml”。

此文件是您完成的站点地图。

如何向Google提交站点地图

首先,您需要知道站点地图在哪里。

如果您使用的是插件,则URL可能是domain.com/sitemap.xml。

如果您手动执行此操作,则将站点地图命名为sitemap.xml之类的,然后上传到网站的根文件夹。然后,您应该能够通过domain.com/sitemap.xml访问站点地图。

边注。 您可以为站点地图选择任何名称,但是最好坚持使用sitemap.xml。如果您有多个站点地图,则可以使用简单的命名方案,例如sitemap_1.xml,sitemap_2.xml。

转到Google搜索控制台>站点地图>粘贴到站点地图位置>点击“提交”

站点地图搜索控制台3

而已。做完了

小费

将站点地图URL添加到robots.txt文件中也是一种好习惯。

您可以在Web服务器的根目录中找到此文件。要添加您的站点地图,请打开文件并粘贴以下行:

站点地图:https://www.yourdomain.com/sitemap.xml

您需要将示例网址替换为站点地图的位置。

如果您有多个站点地图,只需添加多行。

站点地图:https://www.asos.com/sitemap_1.xml

站点地图:https://www.asos.com/sitemap_2.xml

修复影响您站点地图的常见网站错误

Google Search Console会告诉您有关站点地图的大多数技术错误。

例如,以下警告提示robots.txt阻止了我们提交的网址之一:

提交的网址已被漫游器阻止3

您可以在此处了解有关这些问题以及如何解决它们的更多信息。

就是说,有些问题Google不会告诉您。

以下是一些较常见的方法,以及如何查找和修复它们。

网站地图中无用的低质量页面

现在,站点地图中的每个页面都应该是可索引的并且是规范的。

不幸的是,这并不意味着所有这些页面都是高质量的。如果您有很多内容,那么一些低质量的页面可能会将其纳入您的站点地图。

例如,看一下电子商务网站上的以下两个页面:

电子商务2 7

电子商务2 6

它们都不对搜索者有价值,但是它们仍然在该网站的站点地图中,并且Google都对这两个页面进行了索引。

索引接近重复2 3

索引接近重复1 3

要查找这些页面,请转到站点审核>内部页面>内容质量

查找没有规范的重复页面和几乎重复页面的群集。这些是橙色方块。单击一个以查看组中的所有页面。

近重复现场审核3

检查页面,看看它们是否有任何价值。

您网站上的网页质量不佳是很糟糕的,原因有以下三个:

他们浪费了爬行预算。让Google浪费时间和资源来搜寻无用的低质量页面不是理想的选择。他们可能会花时间来抓取更重要的内容。 (根据记录,Google 指出 ,抓取预算“不是大多数发布商都需要担心的事情。”)

他们从更重要的页面“窃取”链接权限。 页面的权限与其排名之间 存在明显的关联。 指向低质量页面的内部链接仅用于稀释可能流向更重要页面的权限。(有趣的是,当我们从Ahrefs博客中删除近1/3的帖子时,我们看到了点击量的增加,而不是减少。)

它们导致不良的用户体验。 登陆这些页面的访问者没有任何价值。访问者点击它们很烦人,如果他们觉得您的网站质量低下而被忽视,他们最终可能会反弹。

总而言之,最好的做法是从您的网站以及随后的站点地图中删除低质量的内容。如果执行此操作,还应该记住删除指向这些页面的任何内部链接。失败的话,您将一个问题(低质量页面)换成另一个问题(链接断开)。

除了重复和几乎重复之外,您还可以查找内容稀少的页面。

只需检查“站点审核”中的“内容质量”报告,以查看带有“低字数”警告的页面。

低字数页面3

意外从您的站点地图中排除的页面

如果您使用上述推荐的任何方法来创建站点地图,则将不包含带有noindex或规范标签(非自我引用)的页面。

这是好事。您不应在站点地图中包含规范化的URL或未索引的页面。

就是说,如果您的网站上有恶意的noindex标记,则页面可能会被意外排除。

要检查错误,请转到站点审核中的“内部页面”报告,然后单击“无索引页面”警告。这显示所有未索引的页面。

Noindex页面3

其中大多数可能会故意没有索引,但是值得略过列表以进行仔细检查。通常,流氓noindex标记很容易发现,因为它们会出现在网站的整个子区域中。

如果您看到任何不应被未编入索引的页面,请从该页面中删除流氓noindex标记并将其添加到您的站点地图中。如果您使用的是CMS或插件,则应该自动进行。

专业 提示

也值得检查流氓规范和重定向。为此,请转到数据资源管理器并添加以下过滤器:

流氓教规3

流氓重定向3

删除所有恶意流氓并重定向,然后将受影响的页面添加到您的站点地图中。

常见问题

以下是一些有关站点地图的常见问题解答。如果您有本节中未回答的问题,请告诉我们,我们将添加它。

您是否需要AMP页面的站点地图?

不。

@ Kfowler325不需要AMP页面的站点地图— rel = amphtml链接对我们来说足够了。—??约翰(@JohnMu)2016年10月13日

如何为电子商务网站创建站点地图?

您可以按照与任何网站相同的方式为电子商务网站创建站点地图。就是说,值得检查电子商务站点上的重复页面和几乎重复页面,因为多面导航带来的乐趣使得这些页面经常在网络中大规模滑动。

最后的想法

创建站点地图并不是火箭科学,特别是如果您使用的插件可以为您完成繁重的工作。从头开始创建一个也不难-只需爬网您的网站并格式化生成的URL列表即可。

也就是说,请务必记住Google不必索引站点地图中的页面。站点地图与排名无关。

如果您正在寻找在排名较高的谷歌,读这个。

拓展阅读:

汶上网站推广分享云优化将告诉您网站建设优化有哪些好处

汶上网站建设公司谈2018万词霸屏推广别被骗了云优化告诉你

汶上网站推广谈如何吸引稳定的网站流量

汶上建站公司谈深圳三合一网站建设出众的网页设计赢在细节

汶上建站分享企业怎样设计网站主题与风格

汶上小程序分享百度烽火算法3.0升级打击网络劫持问题解读

汶上网站推广分享为什么要为网站建设设置404页面

汶上小程序分享SEO团队网站优化服务标准

本文由新城建站整理发布,喜欢请收藏,转载请保留链接 汶上小程序开发分享如何创建XML站点地图(并将其提交给Google)https://www.nccpu.net/jining/wenshang/11324.html

服务支持

我们珍惜您每一次在线询盘,有问必答,用专业的态度,贴心的服务。

让您真正感受到我们的与众不同!