网商课堂_智企云网络商学院

网络推广

搜索引擎为什么要重视原创信息

来源:网商学院 发布日期:2015-08-25 17:13:56 总浏览:2102

一、搜索引擎对原创的态度

1 采集泛滥化

来自百度的一项调查显示,超过80%的新闻和资讯等都在被人工转载或机器采集,从传统媒体的报纸到娱乐网站花边消息、从游戏攻略到产品评测,甚至高校图书馆发的催还通知都有站点在做机器采集。

可以说,优质原创内容是被包围在采集的汪洋大海中之一粟,搜索引擎在海中淘粟,是既艰难又具有挑战性的事情。

2 提高搜索用户体验

数字化降低了传播成本,工具化降低了采集成本,机器采集行为混淆内容来源降低内容质量。

采集过程中,出于无意或有意,导致采集网页内容残缺不全,格式错乱或附加垃圾等问题层出不穷,这已经严重影响了搜索结果的质量和用户体验。

搜索引擎重视原创的根本原因是为了提高用户体验,这里讲的原创为优质原创内容。

3 鼓励原创作者和文章

转载和采集,分流了优质原创站点的流量,不再具属原创作者的名称,会直接影响到优质原创站长和作者的收益。长期看会影响原创者的积极性,不利于创新,不利于新的优质内容产生。

鼓励优质原创,鼓励创新,给予原创站点和作者合理的流量,从而促进互联网内容的繁荣,理应是搜索引擎的一个重要任务。


二、采集很狡诈,识别原创很艰难


1 采集冒充原创,篡改关键信息

当前,大量的网站批量采集原创内容后,用人工或机器的方法,篡改作者、发布时间和来源等关键信息,冒充原创。此类冒充原创是需要搜索引擎识别出来予以适当调整的。


2 内容生成器,制造伪原创

利用自动文章生成器等工具,“独创”一篇文章,然后安一个吸引眼球的title,现在的成本也低得很,而且一定具有独创性。

然而,原创是要具有社会共识价值的,而不是胡乱制造一篇根本不通的垃圾就能算做有价值的优质原创内容。内容虽然独特,但是不具社会共识价值,此类伪原创是搜索引擎需要重点识别出来并予以打击的。


3 网页差异化,结构化信息提取困难

不同的站点结构化差异比较大,html标签的含义和分布也不同,因此提取关键信息如标题、作者和时间的难易程度差别也比较大。

做到既提得全,又提得准,还要最及时,在当前的中文互联网规模下实属不易,这部分将需要搜索引擎与站长配合好才会更顺畅的运行,站长们如果用更清晰的结构告知搜索引擎网页的布局,将使搜索引擎高效地提取原创相关的信息。

          本文由建站平台中亿智企云网商学院为你提供,关于更多相关内容,请关注我们的建站平台

          官网http://www.zhiqiyun.com,或是拨打我们的全国服务热线:400-698-5980


版权与免责声明:智企云文章如需转载请注明原创来源。本站部分文章和图片来源网络编辑,如存在版权问题请及时沟通处理。文章观点仅代表作者本人,不代表智企云立场。

免费索取解决方案

马上享受线上优惠

免费索取解决方案

每天前10名咨询有好礼

智企云 版权所有 © 2016-2018 湘ICP备11017552号

地址:长沙市高新开发区尖山路39号中电软件园总部大楼6楼

Copyright © 2015-2024 智企云 All Rights Reserved. 湘ICP备11017552号 技术支持:中亿智企云

湘公网安备43019002000674号 客服热线:0731-89908988 公司地址:长沙市高新开发区尖山路39号中电软件园总部大楼6楼

电话咨询
获取报价
QQ咨询
微信公众号
返回顶部

智企云服务助手

马上领取2000元新人红包
打开小程序

微信号15874991942已复制,去微信粘贴搜索添加微信一对一咨询

保存或扫描上方二维码添加微信一对一咨询

15874991942

您的信息已成功提交,我们会尽快联系您!