当前位置:首页 > SEO资讯 > 正文

小白自学SEO,如何让网站被收录

很多朋友刚接触SEO,最着急的问题就是,网站做了,内容写了,为什么搜索引擎搜不到?
今天不说那些复杂理论,就聊聊收录这件事具体怎么操作。

小白自学SEO,如何让网站被收录

收录到底是什么意思

简单说,收录就是搜索引擎的爬虫程序,来你的网站把页面内容复制一份,存到它的数据库里。
只有存进去了,用户搜索时,你的页面才有可能被拿出来展示。
没被收录,就等于你的东西根本没进搜索引擎的门,后面的一切都谈不上。

检查收录情况的最直接方法

想知道你的页面有没有被收录,不要去百度搜你的网站名。
正确的方法是,在百度搜索框里输入这个格式:site:你的域名
比如你的网站是 www.example.com,就搜 site:example.com
搜索结果里列出来的所有页面,就是百度已经收录的。
如果什么都没显示,或者只显示了一两条,那就是收录有问题。

新站不收录的常见原因

新网站就像一个没在地图上标记的新房子,搜索引擎不知道它的存在。
最常见的原因有几个:

  • 网站根本不让爬虫访问(检查robots.txt文件)
  • 服务器太慢或者经常打不开,爬虫来了几次都吃闭门羹
  • 网站内容和其他页面高度相似,爬虫觉得没价值
  • 网站结构混乱,内部链接像迷宫,爬虫进去就迷路

主动提交,让搜索引擎知道你的地址

这是新手必须要做的动作。有两个主要的提交入口:

  1. 百度搜索资源平台:去百度搜索“百度搜索资源平台”,用你的百度账号登录。在“用户中心”找到“站点管理”,添加你的网站并完成验证(一般有文件验证、HTML标签验证、CNAME验证三种方式)。验证成功后,在“数据提交” -> “普通收录”里,可以提交你的网站首页和重要页面的网址。
  2. 搜索引擎的主动推送:对于新发布或更新的内容,最好通过API接口实时推送。在百度搜索资源平台的“普通收录”工具里,会给你一个提交接口的地址。当你网站有新文章发布时,程序可以自动调用这个接口,把文章链接推送给百度。

这两种方式可以同时做,不冲突。

小白自学SEO,如何让网站被收录

优化网站内部,让爬虫来了能顺利工作

提交了地址,相当于给爬虫发了邀请函。它来了之后,你的网站要能让它顺畅地逛完。
主要看这几个方面:

检查项目合格标准常用检查工具
页面打开速度移动端最好在3秒内PageSpeed Insights
网站能否被爬取robots.txt文件未禁止爬虫百度搜索资源平台“robots”检测工具
网站结构是否清晰有清晰的导航菜单,文章有分类手动点击,看能否在3次点击内到达任何页面
有无死链接站内无404错误页面百度搜索资源平台“死链提交”工具

内容是吸引爬虫频繁来访的关键

爬虫第一次来可能是你邀请的,以后会不会常来,就看你的内容了。
持续发布原创、对用户有用的内容,爬虫会慢慢提高来访频率。
这里说的原创,不是指一个字都不能和别人一样,而是指信息增量。比如别人只是简单介绍了概念,你提供了具体的操作步骤和截图,这就是有价值的增量。

建立外部链接,增加被发现的机会

除了主动提交,还有一个被动但重要的方式,就是其他网站链接到你的网站。
这种外部链接,就像是别的商店给你指路,告诉搜索引擎“这里还有一家店”。
对于新站,可以尝试这些方式:

  • 在相关行业的论坛、社区的个人签名或回帖中,留下你的网站链接(前提是内容相关,不是 spam)。
  • 如果有朋友或同行有网站,可以请求做一个简单的友情链接交换。
  • 将你的网站提交到一些高质量的、开放收录的行业目录网站。

几个需要避免的误区

有些做法对收录不仅没帮助,还可能有害:

  • 不要大量采集或复制别人的文章,哪怕你做了伪原创处理。
  • 不要隐藏文字(比如文字颜色和背景色一样),企图欺骗爬虫。
  • 不要做一个全是图片或视频的页面,却没有任何文字描述。
  • 不要频繁、大幅度地修改网站的整体结构和页面标题。

收录之后要关注什么

页面被收录了,只是一个开始。接下来要关注索引量。在百度搜索资源平台可以看到这个数据。
索引量代表有多少页面进入了百度的候选库,而收录量是已经被建立索引的页面数量。
有时候收录了但没索引,页面依然不会被展现。
如果发现页面收录了但长期没有流量,可以去资源平台的“索引量”工具看看具体页面的索引状态。

整个过程需要耐心。一个新站从提交到被收录,快的话几天,慢的话几周都有可能。
只要网站基础没问题,内容在持续增加,坚持做正确的事情,收录是水到渠成的结果。

最新文章