avatar

吱托邦

面包会有的,牛奶也会有的,一切都会有的

0%

百度不收录单页面应用和异步数据怎么回事

相信有过个人建站、SEO优化、应用开发经验的童鞋们而言,让自己搭建的网站被百度收录,始终是一种玄学问题,它之所以玄之又玄,主要是因为你的网站或者应用能否被收录,从来没有一种官方的说法,也没有任何衡量的尺度,大家只能不停地琢磨揣测百度等国内搜索引擎到底想怎样,长期这样下去,容易让人神经过敏草木皆兵。反倒是国外的搜索引擎,对你的网站表现得非常友好,几乎都是应收尽收,并且能够让用户真实地搜索到。其实百度不仅不支持收录SPA单页面应用,同时也不支持收录静态页面中的AJAX异步数据。

当然,对于百度为什么不收录你网站的原因,可以说是千千万万,网上这类文章实在太多,这篇文章我只想聊聊为什么百度坚决不支持收录SPA单页面应用、AJAX异步数据呢?如今这个时代,在网站开发领域中,主要分为前端开发和后台开发分离的方式,进一步来讲,在前端开发领域中vuejs、reactjs这类先进易用的高级框架大行其道,尤其是使用它们开发SPA单页面应用并配合各种第三方组件库的加持,让前端开发显得更加优雅,让用户的浏览体验上升了很多个层级,可以说是开辟了一个全新的时代。
然而,虽然vue、react这类框架技术的应用在近五六年全世界新开发的网站中占了主导地位,百度却始终如一地对它们视而不见。根据相关资料显示,目前还不支持收录SPA单页面应用、以及异步数据的搜索引擎,恐怕也只有我们国内了,而我们国内搜索引擎市场流量又几乎全被百度获得。百度不收录SPA单页面应用和异步数据怎么回事

SPA单页面应用收录技术的区别

简单来说,就是因为百度的技术没有革新,还是多年前的那一套抓取网页的能力,只能抓取比较陈旧技术开发的静态网页内容,而百度在抓取使用现代框架开发的网站应用时,只能抓到一片空白。这个和单页面应用的结构有关系,以前使用jquery或者后端模板引擎开发的页面,在被发送到前端浏览器中来之前,就已经将整个网页组装好了,浏览器只负责简单的显示以及后续简单逻辑处理,而如今的前后端分离开发中,使用vue或者react框架后,网页未被解析的内容是先被后端的http服务器(例如nginx)发送到前端浏览器中,然后在浏览器中通过较为复杂的js逻辑代码,将网站页面的所有内容解析并展示出来,并且还伴随着通过互联网获取后台接口数据并异步显示到网页中的。正是这种网站应用的逻辑上的革新,导致百度在抓取这类先进网站的时候,抓到的几乎是一片空白,从而导致无论你的网页内容多么优秀都不可能被百度收录。所以百度不仅无法收录SPA应用,如果你的静态网页中存在需要通过AJAX异步获取的数据,同样也不会被收录,例如很多网页中的评论区就属于典型的异步获取的数据。

SPA单页应用被百度收录的办法

上有政策下有对策,为了让现代网页能够更好被百度收录,vue和react都有相对应的SSR框架,例如nuxtjs和nextjs这类,但是对既有项目的改动太大;以及还有网页预渲染插件,可以将部分需要被收录的网页提前静态化,但不适合大量的网页;或者我们还可以自己使用各类API来自创一个SSR前置组件,如果检测到是搜索引擎的蜘蛛来访,就在服务器将网页全部组装好,最后再发送给搜索引擎,如果不是蜘蛛来访,就返回用户正常的单页面应用内容。但是其实无论怎么去处理让百度收录,这都是一种不符合互联网潮流的方式,是一种委曲求全的方法,就看可怜的国内网站开发运营人员愿不愿意妥协了。百度不收录SPA单页面应用和异步数据怎么回事

为什么百度不更新收录技术

按照上述的说法,无论你的网站是SPA应用,还是说你的静态页面中存在需要通过网络接口异步获取的AJAX数据,百度都是不能收录到的,因为百度压根不支持收录异步加载的内容,它只能收录那些从一开始就全部被组装好的html静态页面。那么至少也有五六年过去了,百度为什么始终没有更新他自己的收录技术呢,至少也要和国际水平靠齐吧。不好意思,可能百度考虑的和我们普通互联网从业人员想的完全不一样:
1、如今每个互联网公司都在圈起属于自己的流量,例如抖音、头条、微信小程序、公众号、微博这类都在打造属于自己的流量圈,而百度如果仅仅作为一个搜索引擎,实则是没有什么前途的,他也在努力打造自己的圈子,例如百家号、百度小程序、百度app等等一系列。他并不想过多地收录其他渠道入口的内容,其他渠道入口的内容也未必愿意让百度收录,比如微信公众号、头条、淘宝抖音等很多其他渠道的内容百度就不收录,他们也不愿意让百度收录,从而进一步削弱了百度的流量和地位。所以近几年百度的心思都在想着怎么搞钱,怎么打造属于自己的品牌阵营,让所有的新闻资讯、热点、商品等都能够从自己的渠道来展示,逐步削弱其他网站内容在百度的显示,所以收录技术更不更新对百度意义不大了,硬是把一个搜索引擎打造成了自己的小圈子。百度不收录单页面应用和异步数据怎么回事2、大环境对于互联网内容的监管日益严格,如今比较先进的这种异步加载内容和数据的网页,其中的内容并不容易被监管和控制,一旦网页被收录了,而动态加载出一些不良内容,可能会造成不好的负面影响,导致他自己背锅,所以干脆就别收录了。这相当于是比各大自媒体平台的机器审核、人工审核机制差不多甚至更严格了。
3、如今除了一些大网站之外,其他小网站的内容基本不能说完全正规,甚至涉及一些灰黑产业,因此如今对于个人网站、新域名、生僻域名、无备案等等一系列问题都是很不友好,基本不收录,收录了也不给权重,属于是无效收录,如今想有条出路是很难的,所以可笑的不是百度而是我们这些互联网打工人,想通过互联网技术来获得一点存在感,找到一点附加价值,结果发现这份红利早就被人搜刮干净了。

文章标题:百度不收录单页面应用和异步数据怎么回事
文章链接:https://www.lovebykin.com/2755301725/
版权声明:若无特殊标注,文章皆由吱托邦原创,转载请注明出处。
赞赏文章:如果文章有帮助,可以通过下方赞赏码对吱托邦进行鼓励。