(聲明:刊用《中國新聞周刊》稿件務(wù)經(jīng)書面授權(quán))
本刊特約撰稿/凌冰 李渝
國內(nèi)對(duì)學(xué)術(shù)論文“造假”的監(jiān)督并非始自今日。2000年3月,上海師范大學(xué)法商學(xué)院的何云峰教授單槍匹馬地建了一個(gè)“好漢網(wǎng)”,豪氣十足地叫板校園里勢頭漸旺的剽竊抄襲等不良學(xué)風(fēng)。
同年,著名“打假斗士”方舟子也創(chuàng)辦了中文學(xué)術(shù)打假網(wǎng)站“新語絲立此存照”,陸續(xù)揭露了500多起學(xué)術(shù)涉假案例,其中包括“核糖核酸”、清華大學(xué)醫(yī)學(xué)院“劉輝造假事件”等引起廣泛關(guān)注的學(xué)術(shù)造假和腐敗事件。方舟子們的學(xué)術(shù)打假多通過網(wǎng)友檢舉,并沒有專業(yè)的儀器進(jìn)行技術(shù)支撐。
2003年,武漢大學(xué)信息管理學(xué)院副教授沈陽在國家自然科學(xué)基金的資助下,研發(fā)了一套與“學(xué)位論文學(xué)術(shù)不端檢測系統(tǒng)”功能相似的系統(tǒng)——ROST反剽竊系統(tǒng),也稱為“學(xué)術(shù)不端行為檢測系統(tǒng)”,并于2008年4月研制成功,目前已在全國20多所高校院系推廣和100多家期刊社使用,但沒有大規(guī)模推廣。用沈陽的話說,“就像原子彈一樣,它是大規(guī)模殺傷性武器,這需要核軍控的”。
在2009年“兩會(huì)”前夕,爆出兩起院士涉嫌學(xué)術(shù)不端行為的事件。6名教授聯(lián)名投訴中國工程院院士劉興土涉嫌“抄襲剽竊”。此前不久,浙江大學(xué)原副教授賀海波盜用他人研究結(jié)果發(fā)表多篇論文。賀海波的博士后合作導(dǎo)師、中國工程院院士、浙江大學(xué)藥學(xué)院院長李連達(dá)的名字也出現(xiàn)在這些“問題論文”上。隨后,教育部部長周濟(jì)就“賀海波論文造假”事件及處理結(jié)果表示,對(duì)學(xué)術(shù)不端行為要像體育界反興奮劑一樣“零容忍”。
2009年3月19日,教育部發(fā)出了《關(guān)于嚴(yán)肅處理高等學(xué)校學(xué)術(shù)不端行為的通知》,這是我國教育部門首次就處理學(xué)術(shù)不端行為發(fā)出通知。通知明確高校對(duì)本校有關(guān)機(jī)構(gòu)或者個(gè)人的學(xué)術(shù)不端行為的查處負(fù)有直接責(zé)任,應(yīng)建立健全處理學(xué)術(shù)不端行為的工作機(jī)構(gòu)。整個(gè)學(xué)術(shù)界頗有山雨欲來的感覺。
正是在這樣的背景下,由中國學(xué)術(shù)期刊(光盤版)電子雜志社與清華同方知網(wǎng)共同研制的“學(xué)位論文學(xué)術(shù)不端檢測系統(tǒng)”(簡稱“TMLC”)開始在高校推廣。
檢測的方法涉及一個(gè)專業(yè)術(shù)語——“自適應(yīng)多階指紋”。什么是信息指紋?沈陽副教授打了個(gè)比方,就是每個(gè)人說話都有口頭禪,這個(gè)口頭禪就是你的一個(gè)特征,這個(gè)特征就叫信息指紋。具體到一篇文章來說,比如研究金庸小說,金庸喜歡用什么字,用字的規(guī)律是多少,每個(gè)字在整個(gè)文章出現(xiàn)的概率是多少,這就是一個(gè)指紋。CNKI科研誠信管理系統(tǒng)研究中心主任孫雄勇向《中國新聞周刊》記者介紹,如果說得通俗一點(diǎn),就是兩篇文章,如果有一個(gè)句子相同,哪怕有一些改寫,都能檢測出來。
“測謊”工具的檢測工作需要強(qiáng)大的后臺(tái)數(shù)據(jù)庫支持,TMLC的后臺(tái)是覆蓋了超過5000萬的學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫。
“測謊”技術(shù)在目前來說,已經(jīng)是一個(gè)成熟技術(shù)了,國外早已廣泛應(yīng)用于多所高校及科研機(jī)構(gòu)。
在一系列反剽竊網(wǎng)站中,最為出色、應(yīng)用最廣泛的莫過于“Turnitin”,中文意思是“交上來”,它也是全球第一個(gè)檢測剽竊行為的網(wǎng)站。該網(wǎng)站目前已阻止了世界范圍內(nèi)將近600萬的學(xué)生和教育者的剽竊行為,在使用高峰期,每天可收到2萬篇論文。
“Turnitin”通過三個(gè)數(shù)據(jù)庫的內(nèi)容來檢測交上來的作品:公眾可以查到互聯(lián)網(wǎng)上所有存檔的文件(超過45億頁,每天更新4000萬頁);成百萬的已經(jīng)出版的作品,包括商業(yè)數(shù)據(jù)庫、期刊摘要等,還有上萬本電子書籍,包括古登堡經(jīng)典文獻(xiàn)收藏;成百萬篇學(xué)生交到網(wǎng)站的論文。
在中國,數(shù)據(jù)庫也在不斷完善之中。不過,“反剽竊”系統(tǒng)要面對(duì)的,似乎遠(yuǎn)遠(yuǎn)不是技術(shù)難題。 ★
Copyright ©1999-2024 chinanews.com. All Rights Reserved