大家都知道采集一定会带来风险,影响有大有小,因为采集的内容页面成本太低了。制作成本上不去,给出的权重一定很低。但是对于大型网站来说,不采集是根本无法跟上产出的需求的。如何能避免搜索的惩罚,又能让产出大幅提升,这一直都是大家非常关心的。今天谈两点自己的看法,

  首先是采集源的选择,这里要回避竞争对手,尽量去采集那些垂直、内容质量相对高并且权重相对低一些的站点,采集源越广泛,降权的风险会小很多。

  其次,采集一定要规律性的方式,我们要根据两个指标来放出数据,一个是栏目等产出,一个是目录的产出,控制好这两个指标数量,逐步放大采集的数量就相对安全很多。