一览index索引定义和用法 index索引是什么意思( 二 )

举例来说，在我们实务上常常遇到有客户的网站是使用AJAX程式建构出动态式的瀑布流，在你进入网站时会看到四则文章连结，接着你滑鼠向下卷动时，程式则会触发并出现后面四则(简单来说就是Facebook 现在的做法，俗称瀑布流)，通常这个状况底下Google的爬虫只会爬取到一开始的前面几则文章而已，因为网路爬虫不会像人类使用者去往下卷动并触发AJAX程式的瀑布流。在这类案例之下，Google的爬虫看到的网页资讯很少，当然也很伤害你的SEO（不管你的网站再棒、再好，只要Google的爬虫看不到，那么根本没有意义）。
因此作为SEOer，研究、了解爬虫的效能是很重要的，我们必须要了解搜寻引擎的爬虫有哪些效能限制、哪些网页技术是爬虫无法好好的爬取（像瀑布流就是大多情况没办法被搜寻爬虫很有效的爬到资料），而Google的爬虫、Bing/Yahoo搜寻引擎的爬虫由各自是不同的团队/公司所开发出来，因此他们的爬虫效能又有些不一样，如果做SEO时希望除了Google之外的Yahoo/Bing也可以优化好，那么就要全部都花时间去研究。
如何确定『检索』或『索引』状况是否有问题这个议题有很多面向可以谈论，在这篇我先谈一些基础观念以及方法。
首先，大部分的情况只要你的网站被Google很健康的『爬取』，收录状况就不太会有问题，通常如果Google有很健康的检索你的网站但却没有收录你的网站，那代表你的网站可能有违规、用作弊的方法做SEO而遭到Google惩处（除了违规惩处之外，很少有网站是检索都没问题，但Google却不愿意收录你的网站）。
那么，要如何检查Google是否有健康的爬取（检索）你的网站呢？常见的方法之一就是透过Search Console的报表（如下图范例）。
（如果你还不知道什么是Search Console，可以参考这篇Search Console新手教学）
这张报表最上方的蓝色趋势图是＂每日检索的网页数目＂，这张图表代表着Google＂每天来爬你的网站时，都爬了多少个网页＂，通常图表会?在一个区间范围内波动，大多情况Google每天来爬多少网页取决于三件事情：
1. 你的网站在市场上有多重要、网站的SEO权重有多高（也就是所谓的Crawl Budget）
2. 你的网站架构是否有使用不利于爬虫的技术，导致爬虫不容易爬到资料
3.你是否有主动阻挡Google爬你的网站（阻挡Google的部分可以阅读非技术人员也能看懂的《meta robots、robots.txt》）
上述报表可以帮你检查Google是否有健康的＂爬取＂你的网站，通常如果Google爬你网页的数字与你的网站落差太大，对SEO都是不太好的，比方说你的网站共有8,000个网页，但Google每天来爬你的网站却只有爬50页~100页左右，如果你的网站有8,000页，Google每天爬的网页数最好在500~1,000之间是比较正常的。
但＂索引＂呢？要如何检查Google有健康的索引我的网站呢？这部分你可以阅读我的学习使用Site指令，诊断《 Google索引》状况，里面有很完整的教学。
在SEO上要如何避免『检索』以及『索引』出问题？撇除你有违规、作弊的行为发生而导致Google不愿意好好的处理你的网站，以下有几个常见的优化项目，也是我们通常在担任SEO顾问时会检查的优化项目：
尽量不要过度使用对Google不友善的AJAX，尤其在重要的网页或内容上面虽然说Google近年来宣称搜寻引擎现在已经能够满有效的解析JavaScript、AJAX技术，但实务上还是有很多网站的JavaScript、AJAX没办法被Google很有效的解析（这篇文章中提到的瀑布流就是AJAX的一种应用），因此尽可能避免在导览列、面包屑、网站侧栏、商品/文章列表这些重要的地方使用JavaScript以及AJAX会比较保险（在这篇文章我先列出几个大方向的常见重点，未来我会在看大家回馈状况各自拉出来写成独立的文章，JavaScript与AJAX这个议题有太多层面要探讨，但简单总结的话就是不要太过度使用AJAX）。

以上关于本文的内容，仅作参考！温馨提示：如遇健康、疾病相关的问题，请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容，希望对您有所帮助：