搜索引擎如何识别原创和伪原创文章?
我可以通过下面几个方面:
1.文章发布时间:相同的一篇文章,发布并且被搜索引擎收录的时间越早,越容易被搜索引擎认为是原创文章。http://www.yixiin.com/
2.关键词词频:这里大家需要了解一个名词:“信息指纹”,信息指纹类似人类的指纹,站长。搜索引擎截取一定目标文字,然后根据一定的算法,将文字及其权重为一定的编码,这些文字可能是几个字符,可能是一句话或者几句话,通常一篇文章对应多个信息指纹,如果你的文章是原创性的文章的话,搜索引擎会根据信息指纹判断。
3.文字顺序:如果两个文本的信息指纹完全相同的话,理论上可以认为两个文本完全一样,但是实际上却不是这样,既然搜索引擎会截取一定的字符作为信息指纹的基础,那么通过打乱这些字符的顺序也可以得到不同的信息指纹。
4.文章锚文本连接:相同的一篇文章,被各个网站相互转载,如果有文章内部的锚文本连接都指向同一个网站的话,这无疑会增加被搜索引擎认可是原创的筹码。
通过以上几点我们不难发现,原来一些SEO所谓的伪原创创作手法在搜索引擎看来是如此的“小儿科”,下面的几种伪原创手法都是不可取的:
1.修改首段及末端:这是绝大多数SEO采用的手法,同时也被广大编辑所认可,简单修改首段及末端就可以让搜索引擎认为伪原创么?LAOLEO认为不一定,当修改幅度不足以影响主关键词词频的时候是不能起到任何作用的,搜索引擎看它和复制的文章没有两样。
2.调整段落顺序:这个就不多说了,简单调整顺序是不能起到任何的伪原创作用。


