- +1
四分之一臨床試驗數(shù)據(jù)造假,“致命缺陷”如何避免?
醫(yī)學領(lǐng)域研究造假狀況令人震驚。一些研究人員的調(diào)查表明,在某些領(lǐng)域,至少四分之一的臨床試驗可能存在問題,甚至完全是捏造的。
英國流行病學家Ian Roberts甚至斷言:“如果你搜索某個主題的所有隨機試驗,大約有三分之一的試驗都是捏造的?!?/p>
他們敦促各方加強審查。
造假普遍存在
John Carlisle是一名在英格蘭國家衛(wèi)生服務中心工作的麻醉師,同時還是《麻醉》雜志的編輯。他以在醫(yī)學試驗中發(fā)現(xiàn)可疑數(shù)據(jù)的能力而聞名。
2017年,他決定仔細搜索他處理過的所有報告隨機對照試驗(RCT)的手稿。隨后3年里,他仔細審查了500多項研究。2020年10月,Carlisle報告了一個驚人的統(tǒng)計:
對于150多項試驗,Carlisle獲得了匿名的個人參與者數(shù)據(jù)(IPD)。通過研究IPD的電子表格,他判斷44%的試驗至少包含有缺陷的數(shù)據(jù):例如不可能的統(tǒng)計數(shù)據(jù)、不正確的計算或重復的數(shù)字或圖形。他判斷,26%的論文存在普遍問題,以至于讓人根本不可信——要么是因為作者無能,要么是因為他們偽造了數(shù)據(jù)。
Carlisle認為,如果沒有IPD,即使是經(jīng)驗豐富的偵探也無法發(fā)現(xiàn)隱藏的缺陷。但就是這一關(guān)鍵數(shù)據(jù),期刊編輯通常不會要求,審稿人也看不到。
他在報告中寫道:“我認為期刊應該假設所有提交的論文都可能存在缺陷,編輯應該在發(fā)表隨機對照試驗之前審查個體患者的數(shù)據(jù)?!?/p>
Carlisle將一些試驗稱為“僵尸”試驗,因為它們看起來像真正的研究,但仔細審查后發(fā)現(xiàn)它們只有空洞的外殼。他做審稿人時,拒絕了所有包含有“僵尸”試驗的研究。但3年過去了,其中大多數(shù)研究已經(jīng)發(fā)表在其他期刊上。
事實上,除了Carlisle研究的麻醉領(lǐng)域外,多年來,許多科學家、醫(yī)生和數(shù)據(jù)偵探都認為虛假或不可靠的試驗非常普遍。他們搜索了女性健康、疼痛研究等多個醫(yī)學領(lǐng)域的隨機對照試驗,發(fā)現(xiàn)大量數(shù)據(jù)在統(tǒng)計學上是不成立的。
這個問題在某種程度上是臭名昭著的論文工廠問題的延伸:在過去的10年里,許多領(lǐng)域的期刊都發(fā)表了數(shù)以萬計的虛假論文,其中一些是由“論文工廠”生產(chǎn)的。
偽造或生產(chǎn)不可靠的隨機對照數(shù)據(jù),是一個特別危險的威脅。它們不僅與醫(yī)療干預有關(guān),還可能成為評估臨床治療的證據(jù)——醫(yī)療指南經(jīng)常引用此類評估,而這些指南是醫(yī)生在決定如何治療患者時的重要參考。
澳大利亞莫納什大學婦產(chǎn)科學專家Ben Mol表示,女性健康系統(tǒng)評價中包含的隨機對照試驗中,有多達20%~30%是可疑的。
不過,也有專家懷疑這個問題是否像最令人震驚的例子所表明的那么嚴重。英國利物浦大學胎兒和孕產(chǎn)婦醫(yī)學專家?arko Alfirevi?說:“我們必須認識到,醫(yī)學領(lǐng)域有一些人提供了大量可疑的數(shù)據(jù),但很多學術(shù)界的學者們認為這是危言聳聽。”
造假數(shù)據(jù)影響到臨床實踐
隨機對照試驗是醫(yī)學研究領(lǐng)域的黃金標準,但如果試驗數(shù)據(jù)造假,就可能嚴重誤導醫(yī)學實踐。
日本骨骼健康研究者Yoshihiro Sato在數(shù)十個預防骨折的藥物或補充劑試驗中偽造數(shù)據(jù)。Sato于2016年去世。Retraction Watch網(wǎng)站顯示,他有113篇論文被撤回。研究人員發(fā)現(xiàn),Sato被撤回的27篇論文被88篇系統(tǒng)評價和臨床指南引用,其中一些為日本骨質(zhì)疏松癥治療的方法提供了參考。
英國阿伯丁大學的醫(yī)學研究員Alison Avenell表示,如果Sato的試驗被排除在外,大約一半的綜述中的一些發(fā)現(xiàn)可能會發(fā)生變化?!八赡軐е氯藗儧]有得到更有效的骨折預防治療?!?/p>
研究人員擔心,在某些領(lǐng)域,來自不同研究團隊的大量隨機對照試驗可能不可靠。
2018年,研究人員發(fā)表了一篇綜述探討給剖宮產(chǎn)產(chǎn)婦服用類固醇,是否有助于減少嬰兒的呼吸問題。Mol表示,類固醇對嬰兒的肺部有益,但可能對大腦造成傷害,在嬰兒早產(chǎn)時,益處通常大于傷害,但在妊娠后期使用時,情況不太明確。
2018年,希臘塞薩洛尼基亞里士多德大學的產(chǎn)科專家Alexandros Sotiriadis領(lǐng)導分析了對妊娠后期剖宮產(chǎn)產(chǎn)婦使用類固醇的證據(jù)。他們最終選擇了四組隨機對照試驗:一項來自2005年的英國研究,有超過940名參與者;三項埃及試驗在2015年至2018年間進行,另外又增加了3000人進入證據(jù)庫。得出的結(jié)論是:類固醇“可能”會降低呼吸問題的發(fā)生率——隨后被引用在200多篇文獻和一些臨床指南中。
然而,2021年1月,Mol和其他人對這些論文進行了更深入的研究。他指出,同一試驗的結(jié)束日期在不同的論文中不一致。同時Mol也對其他的數(shù)據(jù)提出了質(zhì)疑。他寫信給作者,但并未得到令人滿意的回復。其中一名作者告訴Mol,他在搬家時丟失了數(shù)據(jù)。
2021年12月,Sotiriadis團隊更新了其綜述內(nèi)容:排除了除英國研究之外的所有研究。他們是在非營利的民間學術(shù)團體Cochrane的指導意見之下作出的更改,Cochrane的研究誠信團隊提出:作者應嘗試識別“有問題”或“不值得信賴”的試驗,并將其從綜述中排除。
Sotiriadis團隊表示,由于只剩下一項試驗,因此“數(shù)據(jù)不足”,無法得出有關(guān)類固醇的確切結(jié)論。
總體而言,Mol和他的同事指出了超過800篇已發(fā)表的醫(yī)學研究論文的問題,其中至少有500篇關(guān)于隨機對照試驗。到目前為止,這項工作已導致80多篇論文被撤回和50多篇論文被表達關(guān)注。
怎么判斷是否可信?
Sotiriadis認為“Mol是檢測和打擊數(shù)據(jù)偽造領(lǐng)域的先驅(qū)”,但他否認是依賴Mol的工作而做出的更新。Sotiriadis表示,他的團隊遵循了旨在檢查“可信度”的篩選協(xié)議。該協(xié)議提供了作者應遵循的詳細標準清單,以檢查隨機對照試驗的可信度。例如,試驗是否前瞻性注冊;該研究是否沒有異常統(tǒng)計數(shù)據(jù),比如參與者身高、體重或其他特征的平均值分布過窄或過寬,以及其他危險信號。如果未通過前述檢查,那么審閱者將被指示聯(lián)系原始研究作者,如果答復不充分,則排除該研究。
對于Sotiriadis來說,該方案的優(yōu)點在于避免了他不得不宣布試驗有缺陷或欺詐。它們只是沒有通過可信度測試。
這留下另一個有爭議的話題:可信度檢查在某些時候是否對隨機對照試驗的作者不公平?究竟檢查哪些內(nèi)容才能將不可信的研究審查出來?
2021年,Cochrane高級研究誠信編輯Lisa Bero指出,關(guān)于可信度篩選,目前沒有有效的、普遍認可的方法。“將真正的研究錯誤歸類為有問題的研究可能會導致錯誤的結(jié)論,這種錯誤分類還可能致使作者的聲譽受損,產(chǎn)生法律糾紛以及倫理問題?!?/p>
目前,有多種可信度篩選協(xié)議在發(fā)揮作用。例如,2020年Avenell和其他人發(fā)表了名為“REAPPRAISED”的清單,這是一份面向期刊編輯的檢查清單。
在Alfirevi?看來,審稿人使用哪種可信度檢查并不重要,只要他們采取措施更仔細地審查隨機對照試驗即可。
要求提供原始參與者數(shù)據(jù)
Carlisle表示,期刊應該要求作者分享原始參與者數(shù)據(jù)。許多對醫(yī)學試驗造假感到擔憂的研究人員贊同Carlisle的觀點。
英國曼徹斯特大學健康研究員Jack Wilkinson說:“要求分享原始數(shù)據(jù)是一個好政策。我們一直以來的立場都是相信研究,但我們的立場很天真?!比欢?,這一建議與大多數(shù)醫(yī)學期刊當前的做法背道而馳。
2016年,國際醫(yī)學期刊編輯委員會(ICMJE)提議,要求隨機對照試驗進行強制性數(shù)據(jù)共享。但是這一提議遭到了反對,很多人認為共享數(shù)據(jù)會導致試驗參與者隱私泄露,以及數(shù)據(jù)存檔資源的可用性問題。
因此,在2017年更新的指南中,ICMJE僅鼓勵數(shù)據(jù)共享,并要求說明是否共享以及在何處共享數(shù)據(jù)。ICMJE秘書長Christina Wee表示,強制共享原始參與者數(shù)據(jù)的可行性不足,不過該委員會今后可能會重新審視其做法。
許多醫(yī)學期刊的出版商表示,根據(jù)ICMJE的建議,他們不要求試驗作者提供原始參與者數(shù)據(jù)。然而,一些期刊已經(jīng)先行一步,他們明確要求作者必須提供原始參與者數(shù)據(jù)。“大多數(shù)作者在被告知需要提供數(shù)據(jù)時都會提供?!盋arlisle說。
Wilkinson表示,對原始數(shù)據(jù)進行審查是一項耗時的工作,這大大增加了審稿人的負擔。除了要求數(shù)據(jù)外,研究誠信專家還建議期刊編輯可以加快決策過程。
2023年4月,英國議會發(fā)布了一份關(guān)于可重復性和研究完整性的報告。報告指出,當學術(shù)界提出問題時,出版商發(fā)表更正或撤回研究報告的時間應不超過兩個月。
Avenell說:“如果期刊真的撤銷了論文,就應該要求作者改正他們的工作,但這種情況很少發(fā)生?!崩?,2022年,Avenell的團隊發(fā)布報告稱,他們曾反復給88篇引用了Sato撤稿試驗的作者和期刊編輯發(fā)郵件,告知他們的研究綜述中包含了被撤銷的研究,但很少得到回應。目前,只有11篇研究綜述得到了更新,這表明作者和編輯通常不關(guān)心更正綜述。這讓Avenell的團隊感到沮喪,但他們并不意外。
然而,一個長期存在的問題是,為什么會有如此多的可疑的隨機對照試驗產(chǎn)生?Mol根據(jù)自己的調(diào)查經(jīng)驗,把責任歸咎于缺乏監(jiān)督、基于論文發(fā)表數(shù)量來推動學術(shù)發(fā)展的膚淺評估方式,以及機構(gòu)和期刊對不良行為缺乏嚴格的檢查。
“當這些東西不斷被生產(chǎn)出來時,就像撲滅一場野火,最終卻以失敗告終?!盋arlisle說,“解決的方法必須從源頭抓起。”
參考鏈接:https://www.nature.com/articles/d41586-023-02299-w
(原標題為《1/4臨床試驗數(shù)據(jù)造假,“致命缺陷”如何避免?》)





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2025 上海東方報業(yè)有限公司




