怎样的文章算原创?

lipeihao
……你完全自己创作的东西就是原创啊。
画画的话,你照着别人的仿一副就是临摹,自己在脑子里构思然后下笔画出的就是原创。
写文的话,你把别人的文章改头换面写出来是模仿,用别人的梗写自己的文章是借梗,按照自己的灵感写出的只属于自己的文字叫原创。
以此类推……
当然,以上的非原创行为如果标榜为原创作品公开发表甚至商用获利就是抄袭了。

快过期的草莓s
原创文章,顾名思义就是自己独立创作的文章,有着自己独特的观点见解、有自己的语言逻辑、用语习惯、灵感来源,没有复制粘贴他人的文章,即为原创文章。是自己写的、非抄袭或转载的博文。
当然,网络上也不乏许多伪原创文章,即对他人的文章略做修改、再加工,从而发表。而且,网上很多伪原创的文章阅读量等影响力远远超过了原创文章,这也是一种营销手法。
但是,并不提倡大家做伪原创,希望大家能坚持原创!

OK-AJ
自已创作的作品才叫原创作品

棒棒糖糖妈妈
话说原创:语句组合,观点论述,立意结构,写作风格与人不同,就是原创!

change、
关于原创我有话说。第一,原创当然是要作者写出来的,而且从没有被发表过的文章。比如司马迁《史记》,鲁迅的啊Q正传等等,没人敢说不是原创吧。
其次,原创并不完全是作者写出来的内容,只要认为有自己的思想在里面都算原创。写过论文的都知道引用率低于30%的都还算原创。
第三,原创是作者的私有财产,受法律保护。但是,原创是不是有价值,如果有价值的原创,就值得去维护。比如,自己今天拍一张照片,随便发到网上,被别人拿去用。虽然照片是原创,但是其却没有什么价值,这样的原创其实没什么用,甚至比不过别人拿去处理后的价值。
第四,一般来说,原创最好都是作者本人亲自一个字一个字打出来的,而且经过作者思考的,网上或者其他平台从没有类似的文章。
就像我回答这个问题,虽然同一个问题,却有不同的答案,我这个答案是我花了十几分钟打出来的,图片也是我自己拍我家的地。算得上是一篇完完全全的原创。

小胖丫儿头
所谓的原创是独立完成的作品!特指自己写的,并非抄袭、翻译、改编和转载的作品!
原创他是来自于作者的灵感现如今网络文化大行其道,以“原创”为标准的产品铺天盖地,恐怕能说得清摆得明的怕是不多!
但目前网络科技发达,信息传输能力大大增强,一些新型原创形式逐渐诞生可分为艺术性原创、结合型原创、翻版型原创!那么怎么来理解这三类原创呢?
艺术型原创是通过自己的思路加上独有的创意灵感所完成的精湛作品堪称艺术型原创
结合型是通过自己构思设计,借助网络平台上的其它素材在结合自己的作品所达到的满意的作品!
翻版型原创是大部分作品是别人的素材然后经过自己的修改变成自己的作品!

vegetablemeat
有本人出境

____M.
一、搜索引擎为什么要重视原创
1.1 采集泛滥化
来自百度的一项调查显示,超过80%的新闻和资讯等都在被人工转载或机器采集,从传统媒体的报纸到娱乐网站花边消息、从游戏攻略到产品评测,甚至高校图书馆发的催还通知都有站点在做机器采集。可以说,优质原创内容是被包围在采集的汪洋大海中之一粟,搜索引擎在海中淘粟,是既艰难又具有挑战性的事情。
1.2 提高搜索用户体验
数字化降低了传播成本,工具化降低了采集成本,机器采集行为混淆内容来源降低内容质量。采集过程中,出于无意或有意,导致采集网页内容残缺不全,格式错乱或附加垃圾等问题层出不穷,这已经严重影响了搜索结果的质量和用户体验。搜索引擎重视原创的根本原因是为了提高用户体验,这里讲的原创为优质原创内容。
1.3 鼓励原创作者和文章
转载和采集,分流了优质原创站点的流量,不再具属原创作者的名称,会直接影响到优质原创站长和作者的收益。长期看会影响原创者的积极性,不利于创新,不利于新的优质内容产生。鼓励优质原创,鼓励创新,给予原创站点和作者合理的流量,从而促进互联网内容的繁荣,理应是搜索引擎的一个重要任务。
二、采集很狡诈,识别原创很艰难
2.1 采集冒充原创,篡改关键信息
当前,大量的网站批量采集原创内容后,用人工或机器的方法,篡改作者、发布时间和来源等关键信息,冒充原创。此类冒充原创是需要搜索引擎识别出来予以适当调整的。
2.2 内容生成器,制造伪原创
利用自动文章生成器等工具,“独创”一篇文章,然后安一个吸引眼球的title,现在的成本也低得很,而且一定具有独创性。然而,原创是要具有社会共识价值的,而不是胡乱制造一篇根本不通的垃圾就能算做有价值的优质原创内容。内容虽然独特,但是不具社会共识价值,此类伪原创是搜索引擎需要重点识别出来并予以打击的。
2.3 网页差异化,结构化信息提取困难
不同的站点结构化差异比较大,html标签的含义和分布也不同,因此提取关键信息如标题、作者和时间的难易程度差别也比较大。做到既提得全,又提得准,还要最及时,在当前的中文互联网规模下实属不易,这部分将需要搜索引擎与站长配合好才会更顺畅的运行,站长们如果用更清晰的结构告知搜索引擎网页的布局,将使搜索引擎高效地提取原创相关的信息。
三、百度识别原创之路如何走?
3.1 成立原创项目组,打持久战
面对挑战,为了提高搜索引擎用户体验、为了使优质原创者原创网站得到应有的收益、为了推动中文互联网的前进,我们抽调大量人员组成原创项目组:技术、产品、运营、法务等等,这不是临时组织不是1个月2个月的项目,我们做好了打持久战的准备。
3.2 原创识别“起源”算法
互联网动辄上百亿、上千亿的网页,从中挖掘原创内容,可以说是大海捞针,千头万绪。我们的原创识别系统,在百度大数据的云计算平台上开展,能够快速实现对全部中文互联网网页的重复聚合和链接指向关系分析。
首先,通过内容相似程度来聚合采集和原创,将相似网页聚合在一起作为原创识别的候选集合;
其次,对原创候选集合,通过作者、发布时间、链接指向、用户评论、作者和站点的历史原创情况、转发轨迹等上百种因素来识别判断出原创网页;
最后,通过价值分析系统判断该原创内容的价值高低进而适当的指导最终排序。
目前,通过我们的实验以及真实线上数据,“起源”算法已经取得了一定的进展,在新闻、资讯等领域解决了绝大部分问题。当然,其他领域还有更多的原创问题等待“起源”去解决,我们坚定的走着。
3.3 原创星火计划
我们一直致力于原创内容的识别和排序算法调整,但在当前互联网环境下,快速识别原创解决原创问题确实面临着很大的挑战,计算数据规模庞大,面对的采集方式层出不穷,不同站点的建站方式和模版差异巨大,内容提取复杂等等问题。这些因素都会影响原创算法识别,甚至导致判断出错。这时候就需要百度和站长共同努力来维护互联网的生态环境,站长推荐原创内容,搜索引擎通过一定的判断后优待原创内容,共同推进生态的改善,鼓励原创,这就是“原创星火计划”,旨在快速解决当前面临的严重问题。另外,站长对原创内容的推荐,将应用于“起源”算法,进而帮助百度发现算法的不足,不断改进,用更加智能的识别算法自动识别原创内容。
目前,原创星火计划也取得了初步的效果,一期对部分重点原创新闻站点的原创内容在百度搜索结果中给予了原创标记、作者展示等等,并且在排序及流量上也取得了合理的提升。
最后,原创是生态问题,需要长期的改善,我们将持续投入,与站长携手推动互联网生态的进步;原创是环境问题,需要大家来共同维护,站长们多做原创,多推荐原创,百度将持续努力改进排序算法,鼓励原创内容,为原创作者、原创站点提供合理的排序和流量。

原创是独立完成的创作。
原创不属于歪曲、篡改他人创作或者抄袭、剽窃他人创作而产生的作品,亦不属于改编、翻译、注释、整理他人已有创作而产生的作品。特指自己写的、非抄袭或转载的博文。但是网上“约定俗成”,应予认可。
以我对原创的理解,就是所有东西都是自己弄的,尤其是文章,可能我比较纯粹。
还有一个新问题,不知道大家有没有遇到过,你的原创,曾经被别人原创过,不是抄袭的问题,而是你们的观点刚好相似,经历也相似,然后作品雷同……
如果遇到过,请点个赞,只想知道大概有多少人经历过我的经历……

井井
正经的原创个人理解就是不搬运任何网络文章摘抄,仅凭自己脑子里的词汇组成写出的东西,才能称之为原创,其他的都是伪原创,只不过有些人做的高明些,有些人组织能力差,一眼被人看出来而已,个人觉得能让你有兴趣看完的都是好文章,何必苦苦纠结呢?

drommar
很多开始做自媒体的朋友,比如喜欢体育的,喜欢音乐的、喜欢历史的、会费很大劲的整理一批球员的数据信息,一批明星数据的信息,一些历史人物的数据信息,然后进行简单的比较。这种文章从创作本身来说可以是比较低级的原创了。

apcbcandy
有原创作者的个人思想和个人风格,与众不同。

Christelle
自己独立完成没有抄录别人的!

kawayi02
原创这个东西就是自已创作的,什么样的文章属于原创就是有自己深该的思想认识,这样的能表达除自己想表达的一些经历或是故事编写的文章,这样的文章大部分都属于原创的,有自己的版权,这样的文章就属于原创

陈小二
一、搜索引擎为什么要重视原创
1.1 采集泛滥化
来自百度的一项调查显示,超过80%的新闻和资讯等都在被人工转载或机器采集,从传统媒体的报纸到娱乐网站花边消息、从游戏攻略到产品评测,甚至高校图书馆发的催还通知都有站点在做机器采集。可以说,优质原创内容是被包围在采集的汪洋大海中之一粟,搜索引擎在海中淘粟,是既艰难又具有挑战性的事情。
1.2 提高搜索用户体验
数字化降低了传播成本,工具化降低了采集成本,机器采集行为混淆内容来源降低内容质量。采集过程中,出于无意或有意,导致采集网页内容残缺不全,格式错乱或附加垃圾等问题层出不穷,这已经严重影响了搜索结果的质量和用户体验。搜索引擎重视原创的根本原因是为了提高用户体验,这里讲的原创为优质原创内容。
1.3 鼓励原创作者和文章
转载和采集,分流了优质原创站点的流量,不再具属原创作者的名称,会直接影响到优质原创站长和作者的收益。长期看会影响原创者的积极性,不利于创新,不利于新的优质内容产生。鼓励优质原创,鼓励创新,给予原创站点和作者合理的流量,从而促进互联网内容的繁荣,理应是搜索引擎的一个重要任务。 如何判断文章是否原创?来感受一下百度的标准
二、采集很狡诈,识别原创很艰难
2.1 采集冒充原创,篡改关键信息
当前,大量的网站批量采集原创内容后,用人工或机器的方法,篡改作者、发布时间和来源等关键信息,冒充原创。此类冒充原创是需要搜索引擎识别出来予以适当调整的。
2.2 内容生成器,制造伪原创
利用自动文章生成器等工具。