□晨报记者 杨育才
“昨天降到15%,今天终于到10%了,争取明天搞到8%,在最后提交论文前,再花100元上知网查一下,最后不超过10%,肯定就能过了。”李继睿(化名)“啪”地敲了下电脑的回车键,心底窃喜。
李继睿是上海东北片某高校金融系2011级的硕士研究生。再过半个月,他就要进行毕业论文答辩。为了能顺利过关,李继睿已在淘宝上花了近200元购买论文检测服务,以精确计算论文的引用比例。和李继睿一样的大学生不在少数,淘宝上出售该软件最多的一家店铺,在一个月内竟有两三百万次的交易量。
近日,记者调查发现,这些被学生称为“查重软件”的系统,原本仅提供给高校和研究机构内部使用,用来检测学术论文是否存在抄袭等行为。如今,论文查重已形成一个产业,在被滥用的同时,其反抄袭的功能已被异化。尽管对各种反抄袭检测系统评价不一,但记者所接触到的很多本科毕业生都表示:不得不用。
[现象]
学生自费上网查重复率
在李继睿的班级里,包括他在内的近一半同学已有了工作意向,毕业论文答辩是他们三年研究生生活的最后一关。
“导师提醒过很多次,一旦提交后被知网检测重复率超过10%,就只能延迟答辩,甚至可能取消答辩资格。”在3万多字的初稿完成后,李继睿对自己的论文比较满意,“虽然没能提出很新颖独到的观点,但至少结构完整,逻辑清晰,导师也没提出很大的修改意见”。
但接下来的查重,却让李继睿大吃一惊。
30.5%!第一次查重,李继睿“蹭用”了同寝室从淘宝上买来的Papertest检测系统。李继睿自信没有抄袭,但面对系统检测出来的重复率,他不得不认真修改。第二天上午,李继睿在淘宝上支付了40元后,按照淘宝店家的指导,输入订单号,提交修改后的论文,经过近5个小时的等待,报告显示重复率下降到了15.2%。
淘宝该类店达500多家
近日,记者在本市几所高校的毕业生中采访得知,部分高校会免费为毕业生提供一次查重,像李继睿这样仍然有查询需要,多次上网购买的不在少数。
5月18日上午11点左右,记者在淘宝中检索“查重”、“论文检测”,一共检索出500多家店铺。按照销量排序后,一个月内成交量上万的就超过10家。其中一家在30天内成功交易22524件,单价45元,可检测14000字以内的论文。一个月内,这家店靠出售查重服务收入就超过100万元。
记者发现,淘宝上热门的查重系统主要有Paperpass、知网、万方、维普、Papertest等。这些系统在淘宝上的价格各不相同,最低的10000字仅需1元,最贵的10000字需要三四十元。
谈及这几个系统的差别,李继睿透露,知网比较权威,国内高校使用率最高,但价格最贵,也不对个人开放; 其余几个系统或有个人版或完全对个人开放,但是由于各自的数据库不同,提交同一篇论文检测出来的重复率也不一样。
李继睿说,由于各系统价格高低不一,学生一般会先购买便宜的检测系统给论文做“初检”,到修改定稿前,再花高价选择知网的系统。
据知网工作人员介绍,上海共有25所大学在使用他们的大学生论文检测系统。记者随后登录本市几所大学的官方网站发现,尽管都采用了这个系统,但是不同院校对论文重复率的要求不同。比如本市东北片某高校经济学院规定:“文献综述部分复制比例少于30%,且其他任意一章的文字复制比例均少于10%,才被视为达标。”上海体育学院规定论文的重复率不能超过15%; 浦东一所民办大学则更为宽松,只要检测出来的重复率不超过30%即可。
[调查]
系统只是机械性找相似
记者发现,所有的论文检测系统在宣传中都强调只做论文相似度检测,不判断是否抄袭。
“所谓论文相似度检测,看似智能,说白了就是机械地查找论文中词句的重复率。”上海财经大学统计与管理学院大四生郑晓野(化名)说,检测后相似度高的句子或者段落只要稍作文字上的修改,比如换成同义词,再次检测就能降低重复率。
为证实小郑的说法,记者在Paperpass上注册了一个账号,并充值10元,然后提交了一篇尚未发表过的政治学论文部分内容,约3000字,检测报告显示相似度为33.4%。
经过检测后的论文文字,变成了红色、橙色和绿色三个部分。红色相似度70%以上,属于严重抄袭;橙色为相似度40%-70%,是部分抄袭;绿色为原创。其中名词“中国特色社会主义道路”被多次标示为红色。
按照检测报告提供的“修改建议”,并参考网上流传的“查重攻略”,记者将多处红色的词句进行了简单改写,表达的意思基本不变,然后再次进行检测,重复率下降到22.6%。
网上流传的“查重攻略”还有很多,比如将引用的外文文献翻译成中文;将抄袭的文字转换成图表,或者图表转换成为文字;以及连续引用不要超过13或者15个字等等。
对“思想剽窃”无能为力
记者在采访中发现,在提交前进行论文检测的,本科生较多,硕士研究生次之,博士生较少。复旦大学哲学学院博士生周爱民表示,自己周围的同学很少在写论文的过程中查重。“在引用某人思想时,一般是转述并注明出处,特别精彩的句子才直接引用,这样重复率和引用率会很低。”
“利用数据库对特定长度的内容进行比对,可以杜绝大段的抄袭。但它的作用也是非常有限的,我在德国和当地研究人员交流过,他们没有类似这样的论文检测系统。”周爱民的导师、复旦大学哲学学院教授王凤才目前正在德国访学,在接受晨报记者邮件采访时认为,查重软件只能防止低水平的直接抄袭,很难杜绝高水平的思想剽窃。“譬如,重要学术观点的引用,不注明来源、不说明出处(这个问题不限于学生),这比抄袭一段文字严重得多,查重软件对此无能为力,只能通过导师和同行专家严格把关才可能被发现。”
在接受记者采访时,上海交大一位不愿具名的教授认为,反抄袭系统对于遏制抄袭剽窃等学术不端行为的确发挥过很大作用。“但目前的情况是,学生用得比老师还熟练,总结出了那么多规避方法,其反抄袭的功能大大削弱了。今后应该研发出真正智能的系统,检测出观点上的抄袭,而不仅仅是字面雷同,那才有实际意义。”
王凤才教授认为,如果查重仅仅是用来检测是否存在大段的直接抄袭,学生完全没有必要自查。“对学术腐败,这类软件可能会起到一定威慑作用;但要减少、杜绝学术腐败,应该依靠社会的力量,譬如建立一整套‘信用制度’。”
[幕后]
只为学校提供服务的系统
怎会在网上卖得热火朝天
李继睿和郑晓野说,如果毕业论文在提交前不查一下,心里没底。花钱自查,其实是买个心里平安。
“一个为钱,一个为面子。”上述不愿具名的教授认为,反抄袭系统的研发机构,通过市场推广大发其财;作为学校,也不希望自家毕业生的论文在盲审中被查出重复率过高。
学校提供两次毕业论文检测,似乎是高校通行的做法。这和某知名大学生论文检测系统的推广方案也是一致的。
记者获取了一份推广方案,其中有面向机构用户的报价单。和宽带上网价格一样,论文检测系统采用流量和包年两种收费模式。以包年模式为例,收费取决于毕业生人数,如某校有3000名毕业生,需年费9万元,可获得20个子账号,可检测论文数量为6000篇左右。
在淘宝网,一家名为“蚂蚁库”的店铺自称出售的是知网检测系统。
昨天下午,记者联系上了这家淘宝店的客服“mycool5288”。“mycool5288”表示,他们出售的知网论文检测系统账号来源于高校拥有论文检测权限的老师,是最新的系统,在线检测,同步更新。除了每次检测有14000字数的限制外,检测报告和查重率和知网官方检测基本没有区别。
只向机构提供服务的知网论文检测系统,怎么会在淘宝上卖得热火朝天呢?在回答记者提问时,知网客服称,知网从来没有授权淘宝任何一家店铺做论文相似度检测,只有通过高校图书馆才能得到真实的检测数据。
然而,知网学术不端文献检测系统在其主页上的一则声明,部分证实了“mycool5288”的说法。声明称,近一段时间以来,一些用户违反使用协议,通过淘宝等网络交易平台,向个人提供检测服务,在社会上造成了不良的影响。这则声明从2012年9月29日一直张贴到今天。
那么,这些账号又是如何从高校流向淘宝的呢?淘宝的客服解释说,无论知网还是万方、维普,会根据年费的多少,给高校等机构用户提供数量不等的子账号,分配给图书馆、教务处或者各院系。一些高校只对毕业论文进行抽检,比如1000个毕业生抽检100篇,那么剩下的900篇名额,闲置可惜,掌握子账号的老师就可以拿到淘宝上高价出售,或者向学生收费后提供检测。
[记者手记]
莫让“反”抄袭成了“助”抄袭
□晨报记者 杨育才 当学术论文从纸质迈入电子化后,抄袭也同步从“剪刀+浆糊”进入到“复制+粘贴”时代,抄袭成本大大降低。反抄袭的手段也应运而生,从论文数据库里诞生出论文检测软件,似乎是水到渠成、顺理成章的事情。但这些软件该怎样利用,却是另外一码事。
一张绘有防盗机关的地图在主人手里,可以帮他看家护院;但如果落到了盗贼手中,这份地图不仅帮不了主人,反倒会成为盗贼的工具。
论文检测系统,就是这样一份“地图”。掌握在高校教务处、图书馆、期刊杂志出版社手里,可以是学术反腐的基本手段,帮助检测出大段抄袭剽窃等学术不端行为。但如果这份“地图”遍地都是,甚至还附带着“破图攻略”,所有的论文作者都唾手可得,就完全违背其“学术反腐”的初心了。
正如一名接受采访的大学毕业生所言,投入重金开发的反抄袭系统,也会成为抄袭者自我保护的工具,这真是一个滑稽的现象。
不可否认,论文检测行业近年来发展得如火如荼,主要是因为学术反腐的需要。但经济利益的驱动,又使得论文检测出现了产业化和畸形化的发展,这是需要警惕的现象