随笔1

by admin on 2020年3月14日

开发者 Cody Ogden 通过 GitHub 建立了一个网站“Killed by
Google”,该网站收录了 Google
淘汰的自家产品,作者形象地把网站叫做“谷歌产品的墓地”。

让搜索引擎快速收录网站

搜索引擎:谷歌搜索引擎特点及独有搜索方法

  1. 变动较快,机动性较高
  • Google 漫游器会定期抓取
    Web,将大量网页列入索引。稍后完成的下一次抓取会注意到新网站、对现有网站的更改以及失效的链接,并对内容的变化在搜索结果中加以调整。
  1. 敏感度较高,反应较快
  • Google对新建的网站具有较高的查知性,当然,新建的网站必须要有外部链接或者向Google递交过网站登录信息。否则,即使Google的搜索技术再厉害,一个只有站长一个人看得见的网站是很难被Google发现的。Google收录新建网站的两个途径是:第一,通过网站的外部链接;第二,通过向Google提交网站登录数据。一般而言,后者的收录速度相对较快,而前者则要视Google对新建网站的外部链接网站的收录频率而定。如果Google对外部链接网站的评价高、收录频率高那么其发现新站的速度也相应地高,新建网站被收录的日期就会被提前。
  1. 较重视链接的文字描述
  • Google会将链接的文字描述作为关键词加以索引
  1. 相关性和重要性并重
  • Google 使用 PageRank
    技术检查整个网络链接结构,并确定哪些网页重要性最高。然后进行超文本匹配分析,以确定哪些网页与正在执行的特定搜索相关。在综合考虑整体重要性以及与特定查询的相关性之后,Google
    才将最相关最可靠的搜索结果放在首位。这也是Google收录网页的特点之一。
  1. 较重视网页Meta标记的描述
  • 大多数时候Google显示搜索结果时会把网页的Description显示出来,并占有较重的篇幅。
  1. 谷歌独有的搜索方法
关键词 用法
星号* 常用的通配符
link 搜索url的反向链接,既包括内部链接,也包括外部链接
Inanchor 指令查询的结果是导入链接锚文本中包含搜索词的页面
related 返回的结果是某个网站有关联的页面
info 显示与链接相关的一系列搜索
cache 用来搜索在谷歌服务器上的某页面的缓存

图片 1

或许很多朋友面临这样的窘境,网站刚上线,提交完搜索引擎,可是搜索引擎并没有马上收录网站,而是过了很长一段时间才收录网站的首页。这是一个可能让人发疯的问题,如果每一个新站都等很长一段时间,那么谁还会对搜索引擎感兴趣?如果要让搜索引擎快速收录网站,就要仔细研究以下几个方面,进而达到推广与优化的目的。

协同过滤的国外案例

网站上各个产品简介中指出了其诞生与死亡时间,并链接到该产品的具体描述页面,同时还配上了“墓碑”图标,更有墓地的意味。目前该项目已经收录了
150 多款已死产品,同时收录了一些正处在死亡线上的产品。

 

亚马逊的推荐:从商品到商品的协同过滤

图片 2

1.对于Google搜索引擎

推荐算法

  • 大多数推荐算法,都始于先找出一个顾客集合,他们买过和评级过的商品,与当前用户买过和评级过的商品有重叠2。算法把来自这些相似顾客的商品聚集起来,排除该用户已经购买过或评级过的商品,并向该用户推荐其余的商品。这些算法有两个最常见的版本:协同过滤和聚类模型。其他算法——包括基于搜索的方法以及我们自己的商品到商品协同过滤——都集中于寻找相似的商品,而不是相似的顾客。针对用户所购买和评级的每一件商品,算法试图找到相似的产品,然后聚集这些相似的商品,并给予推荐。

其中很多产品寿命都比较长,但也可以看到不少短命仔,目前收录最快夭折的是
Quickoffice,它只活了 4 个月就惨遭杀害。

Google有很多工具,包括邮箱、常用的Google工具条,以及其他的产品,这些产品对于网站的收录都有一定的作用。但是,因为它的服务相对比较容易,很多人并没有研究或者关注过它。新建设好的一个网站,应该提交给搜索引擎还是通过其他的方式来收录呢?如果选择向Google提交网站,那么应该注意以下几点。

为何值得知道?

  • 亚马逊作为推荐算法的先驱,具有意义和代表性,且受众面较广,较为常见。

图片 3

l  
在提交给搜索引擎之后,应该准备好网站地图。网站地图的格式最好是以XML格式结尾,当然也可以使用其他格式的网站地图,但是远远比不上XML格式结尾所达到的效果。

为何符合定义?

  • 与把当前用户匹配到相似顾客的做法不同,商品到商品的协同过滤,把该用户所购买和评级的商品,匹配到相似的商品,然后组合这些相似的商品进入推荐列表。

(文/开源中国)    


不能过多或者反反复复地将网站提交给搜索引擎,每次给搜索引擎提交的网站信息都会存储在搜索引擎数据库的缓存中,也就是说有一定的记录,每个人提交一个网址,确实是很少的,但是很多人都在同时提交自己的网站,这样会给Google的服务器带来很大压力,所以在提交的时候,提交一次即可。这是主动给搜索引擎提交。

如果在不急的情况下,希望Google通过自然收录的方式来抓取网站,那么需要在网站哪些地方采取措施呢?在这里希望广大站长能够分清楚,Google和百度是有区别的,在做Google的收录时,重点应放在Google喜欢的那些类型网站,如PR值比较高的网站或者收录速度比较快的站、博客网站、威客类型网站等,这些资源都是Google比较喜欢的,可能有很多论坛收录速度也很快,但是PR值并不是很高。那么有人会问在论坛上有没有效果,如果在同等PR值的论坛上做,可能还没有在同等PR值的博客上来得更划算、更直接。通过这些因素,希望广大站长能够分清楚百度和Google的侧重点在哪里。

为什么要考虑提交采用不同的手段呢?原因是给搜索引擎的第一印象如何,主动提交可能没有搜索引擎主动来抓取权重高,最好根据自己网站的实际情况来对网站进行提交。

2.对于百度的收录

让百度收录自己的网站并不那么容易,因为百度在这段时间的变化让人难以琢磨。让百度收录网站的内容分为5点。


主动向百度提交。这个提交99%都是没有用的,但是这一步不能忽略,因为百度有的时候也学Google有个沙盒,可能将网站收录进去,并没有把网站放出来,但还是和Google有区别,可以通过平时观察得到结果。例如,查询一下自己的网站收录情况,假如本月22日的网页出来了,但是收录的时候往往是在下月10日左右,这个时候就要考虑到一个因素,提交这一步是必不可少的,因为百度在收录网站时会考虑很多因素,让网站的站长们和一些企业网站的老板都很头痛的。对于百度也是一样,不能提交得过于频繁。


考虑百度喜欢的一些网站。百度目前为止最看重的是论坛,当然在一些大型的新闻类网站上发一些链接是最好的,但普通人很难实现,所以要瞄准百度所看重的论坛下手。当然在操作的时候不能发一些广告,这样会导致被管理员删掉,或者封号、封IP。所以需要一些技巧,想一想自己需要的是什么,如果只是需要搜索引擎看到网站的一条链接记录,顺着链接能爬到自己的网站上来,那么做的目的只有一点儿,只要能让论坛保留链接即可,在论坛里面操作的时候没有必要发表大量的帖子,也没有必要到处发广告,只要在论坛签名中附带着网站的链接即可。设置好论坛签名后,如果不敢保证发布的内容不被K掉,那就在论坛里面跟帖、灌水。回复一个帖子,签名会自动发表到网页中,这样目的就达到了。


从百度自身来考虑。有的人说百度的自身就是百度知道、百度贴吧、百度空间之类的服务,这些服务对百度收录是有一定作用的。做SEO不能心里太急躁,今天发了一个帖子或者回答了一个百度知道,明天就能看见收录,那是不现实的,需要一段时间才能看见效果。在百度的这些服务中,不能做一些重复性的东西,一篇文章天天发表,一个答案在什么问题里面都回答,这样是没有用的。很多人都知道百度是一个标题党,2006~2007年,百度对标题的敏感性是很大的,网站稍微修改一下标题,百度蜘蛛用不了多长时间就来抓取页面,有可能上午发表一篇文章,下午就收录了。但是现在在百度贴吧和知道中操作,没有权利去修改标题,只好尽量做到让内容不一样,附带上网站的地址和关键词。


要尽量避免网站上挂一些和百度直接竞争或者间接竞争的服务,例如,阿里妈妈的广告、Google的广告。如果网站正处于收录阶段,最好什么东西也不要挂。如果网站是一个新站,正在百度收录期间,或者刚刚被收录了几天,不要挂这些东西,即使挂上了,这个阶段也赚不了多少钱,同时还有可能让百度对网站产生厌恶感,不来收录网站。


可能从百度附属网站、相关网站、旗下网站来操作,例如hao123、有啊。它和百度贴吧、百度知道等不是一个系统,但是百度对自己家的产品还是会非常照顾的。

说了这么多,目的就是为了能让百度收录网站。从上面几点已经分析出来百度到底喜欢抓取什么类型的网站,什么类型的网站能对网站的收录起到一定的作用。在做让百度收录网站的时候,应该按照步骤去做,不能说百度不收录网站,心里非常着急就什么都去做,没有一个层次性和主次性,这样精力很容易被分散,结果哪一样都没有做好。对于百度的收录,可能还会有一些其他的方法,例如利用自动提交的程序,但建议现在不要再使用。以前笔者做过类似的一款软件,可以1秒钟向百度提交多次,这样做现在不仅起不到什么太大的作用,反而让百度更加反感网站。

 图片 4

 

 

 

本文节选自《SEO兵书:搜索引擎优化手册》一书。

图书详细信息:

 

相关文章

发表评论

电子邮件地址不会被公开。 必填项已用*标注

网站地图xml地图