seo

SEO

Robots

爬虫协议。规定为小写的robots.txt,放在网站根目录。用于告诉爬虫此网站中的哪些内容是不应被搜索引擎的爬虫获取的,哪些是可以被爬虫获取的。

Robots主要包含以下几大部分

本站的robots.txt

1
2
3
4
User-agent: *
Disallow: /search
Allow: /
Sitemap: https://kekek.cc/sitemap.xml

次规则适用于所有爬虫,/search下的内容不可以被抓去,其它所有网址都可以被抓去。站点地图地址为https://kekek.cc/sitemap.xml

sitemap

站点地图。主要为xml格式,里面包含站内网页的连接。

主要属性:

  • lastmod

    页面最后修改时间

  • loc

    页面永久链接地址

  • priority

    相对于其他页面的优先权

示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

<url>
<loc>https://kekek.cc/baidu_verify_V1VRvzkxVm.html</loc>
<lastmod>2018-05-04T10:38:47.003Z</lastmod>
</url>

<url>
<loc>https://kekek.cc/2017/03/23/bitwise-permission/</loc>
<lastmod>2018-05-03T12:53:55.729Z</lastmod>
</url>
</urlset>

Google

访问https://www.google.com/webmasters/tools/home?hl=zh-CN添加站点。

Baidu

访问https://ziyuan.baidu.com/linksubmit/index添加站点。

本站采用「署名 4.0 国际」进行许可。