态分布的资料就必须用非参数检验方法,如秩和检验和精确概率法等。多组间的比较可能需要采用方差分析;随访资料(如随机临床试验、队列研究等)用生存分析方法可能更佳;存在多因素的因果关系分析(如预后因素分析、病因学研究等)需要多元回归分析等等。不少论文在交代统计学方法时,笼统地说采用多元回归的方法,究竟是哪一种回归方法没有说明,从“结果”中也看不出其资料是否采用了回归方法。滥用相关分析和直线回归的现象也很普遍。实际上,相关分析是一种低层次的统计学分析方法,主要用在描述性研究(如横断面研究)的资料分析,而一般不用于实验性和分析性研究的资料分析。因为相关分析有统计学意义并非代表两组资料存在相关关系。由于在回归分析的统计学教学中,一般是从直线回归到Logistic回归,再到cox回归,因此回归分析的原理和精神,多在直线回归中进行交代,使学习统计学的医学研究生们普遍对直线回归的印象较深。其实直线回归分析很少被运用于医学研究,医学研究中运用的最广的回归分析是Logistic回归和COX回归。 另外,风湿病学论文中,极少提到样本量的推算。样本量的推算主要是使研究的结果避免犯统计学第Ⅱ类错误。第Ⅱ类错误是指由于样本量不足,使得本来有差异的两组,运算出无差异的结果。样本量的推算是根据研究者期望的差异值、检出意义的水平(α值)和研究的功效(1-β值)。β值是允许犯第Ⅱ类错误的概率。一般要求α值=0.05,研究功效在0.8或0.9。当你的研究结果中存在P值>0.05时,则要求文章有样本量的推算,或提供研究功效。
3.结果
写论文最主要的目的就是向读者展示研究的结果,论文的核心和精髓主要体现在“结果”部分。因为在“引言”部分,你所提出的问题,均可在“结果”部分找到答案。这部分要求对研究结果进行客观的陈述,既不受其他文献的影响,也不受作者主观意愿的左右。所以图1所示,“结果”部分是一个方形的结构,提示它不需要拓展,只是要客观的陈述。 一份好的“结果”,必须让读者顺着你的思维,一步一步地获得答案。通过文字告诉读者本研究发现了什么;通过表格将具体的数据有条理地展现给读者;通过图形使读者能够直观地理解研究的结果。 3.1研究资料基线的描述 虽然有些作者将研究资料基线的描述放在“材料与方法”中,但实际上基线的描述放在“结果”中更加确切。因为“材料与方法”主要是交代研究的计划,至于所收集的病例中年龄多大、男性占多少、病程多长等等,是在结束研究后资料分析时才知道。如果是分组的研究,需要比较各组间的基线是否相同。随访研究还要比较失访者或中途淘汰病例的基线是否有别于组内待分析病例的资料,让读者知道失访或中途淘汰病例是否导致研究的偏倚。 3.2统计学运算结果实验性和分析性研究的结果很大部分是来自统计学运算的结果。这里结合这几年风湿病学论文的“结果”部分常见的一些错误(不一定在本刊)进行讨论,以减少今后的论文继续出现类似问题。 3.2.1P值问题:尽管中华医学会杂志社一直强调“应尽可能给出具体的P值”,但是风湿病学的论文中用“<”或“>”来表示者仍占绝大多数。曾对来审稿件和一些已发表论文,根据文章中所提供的资料(如病例数、均数、标准差等)进行复算,发现不少错误或欠缺。例如有些P值在0.05~0.1之间,却被写成<0.05;一个表中,多个组合的比较,作者用“ 为P值<0.05, 为P值<0.01”, 为P值<0.001”,复算的结果是“ ”的数值中有些P值是落在0.01~0.001之间或0.001以下。既然文章中已阐明统计学运算是采用统计软件,计算机运算的结果就肯定是具体的P值,因此论文没有理由不给具体的P值。只有当P值非常小,计算机运算结果显示的P值为“0.000”时,论文中才标“P值<0.001”。 3.2.2注意相关强度及其95%可信区间的表示:临床研究的结果常常涉及到相关强度的运算,最常用的是OR值和RR值。有些已发表的论文,作者明明在统计学方法中说用Logistic同归或COX回归,但结果中却找不到OR值或RR值。相关强度及其95%可信区间的运算和意义己在前面几讲中讨论,这里不重复。值得一提的是,不少文章中OR值或RR值的95%可信区间包含了1,P值却<0.05,计算机肯定不会运算出这样的结果。 3.2.3数据必须与研究资料一致:少数论文的结果中,数据与研究资料相差太大。例如一篇长期随访的研究,在“材料与方法”中注明“为1985年1月至2000年12月”,而“结果”中的3个生存曲线图,均显示曲线右端到达25年,究竟是哪个环节出问题呢?
|