■王德華
科學是以數據說話的,任何科學結論都需要數據支持。數據不嚴謹,會產生不嚴謹的結論,甚至是錯誤荒唐的結論。這對社會的影響是極大的,尤其是涉及國計民生問題時,錯誤的數據很可能會導致錯誤的決策,進而造成巨大的損失。所以,實驗科學無論怎樣強調數據都不為過。
最近,我和學生們在組會上又聊到了數據取舍的問題。我的研究生剛剛獲得了一個實驗的部分數據,需要統計處理組與對照組的差異,但統計后他發現,有一組數據標準差太大,統計結果是“差異不顯著”。
我們的實驗研究需要檢驗處理組和對照組之間的差異,或不同因素處理的效應,在這一過程中,令研究人員最頭疼的問題就是實驗結果與預期不一致,本該有差異顯著性的數據,卻檢測不到差異顯著性,概率值大于0.05。在我們平時的科研工作中,這種情況很常見。
在討論的時候,我跟他說:“如果個別數據偏離了整個樣本的變化趨勢,要特別重視,首先分析自己的實驗過程是否有問題、樣品是否有問題等。不符合預期的數據是絕對不能隨便刪除的,可以在分析數據的散點圖和標準差后,決定是重復一次實驗,還是增加樣本數。”
數據取舍,是我們組會上經常討論的問題。我一般會跟我的學生說,出現個別偏離的數據,要認真分析是不是這個樣本有問題,并結合這個樣本的其他參數予以考慮。比方說,如果同一個動物實驗中,多個參數都出現了問題,就要考慮可能是動物樣本的問題;如果僅是某個參數不符合預期,可以分析測定過程是否出了問題。但基本原則是,不能隨便刪除數據。
面對個別偏離的數據時,我們的處理方法一般有以下三種。第一,再重復測定一次;第二,如果問題依然存在,又不好解釋,按照數據散點圖,將偏離平均值范圍太大的數據在散點圖上標記出來,統計分析時,說明這個數據沒有被統計進來;第三,根據統計學中判斷奇異值的方法,進行個別數據取舍。
有時我們會發現,統計結果是由個別數據引起的,如果去掉偏離平均值范圍大的數據,差異顯著性就出來了。這時,有些研究人員就會產生一種取舍數據的沖動,想刪除這個不理想數據。但這是很危險的,因為隨便取舍數據,或根據自己的需要取舍數據、選擇性使用數據,就觸碰到了學術不端的紅線。
我認為,研究人員產生數據不當取舍行為的一個直接原因是功利化心態、浮躁心態。例如,研究生有畢業發表論文的需要,年輕學者有晉升和申請各種名譽獎項的需要等。如果沒有正確對待科學的心態,沒有對待科學數據嚴謹的態度,而是論文至上,再加上沒有強有力的監督機制和懲罰措施,出問題是不奇怪的。
為避免不當的數據取舍,應該對實驗的原始記錄給予高度重視。我們實驗室每周都有組會,大家有數據就會在組會上討論。研究生和導師交流時,也要提供原始數據。
在我以前工作的中國科學院動物研究所,我負責研究生教育工作多年,研究所學位委員會制定了導師檢查研究生實驗記錄的制度,每學期都要進行檢查,記錄本上有導師的簽字。導師檢查學生實驗記錄,也是研究生中期考核、申請學位論文答辯的一個重要條件。研究所為此專門定做了實驗記錄本,每頁都有頁碼,不能隨便撕掉。實施效果還是不錯的。
總之,做實驗要尊重原始數據,嚴肅認真,認真對待每一個數據,認真對待科研和實驗過程的每一個步驟,認真做好實驗記錄。不可以更改數據,不可以選擇性地取舍實驗數據!
(作者系山東大學生命科學學院特聘教授,本文由本報記者倪思潔采訪整理)
中國-博士人才網發布
聲明提示:凡本網注明“來源:XXX”的文/圖等稿件,本網轉載出于傳遞更多信息及方便產業探討之目的,并不意味著本站贊同其觀點或證實其內容的真實性,文章內容僅供參考。