大话统计学(溢彩实训版):基于R语言+中文统计工具
上QQ阅读APP看书,第一时间看更新

1.5 统计数据的收集

要得到样本数据,可以通过实验与调查(包括观察)两种方式。

定义:实验(experiment)是对样本,加以控制(control)分组,再进行测量或观察。

例如:医学实验,将病人分成两组或两组以上,利用不同的药物治疗(控制),再观察其病情。实验数据通常经由方差分析或双总体统计检验,作统计分析。

利用实验进行统计分析,要注意下列几点:

(1)分组时要利用随机性,以尽量消除其他非控制因素。例如:要记录病人吃药后的病情,除了不同药物治疗(控制分组)以外,还有病人的年龄、血型等其他因素,会影响病情。所以随机性是,将病人随机分布到不同的药物治疗分组。

(2)实验分组作统计分析的主要目的是,比较不同组的结果是否有不同。为了使其结果比较客观且有意义,可使受试者不知道自己在哪一组,例如:消费者不知道自己用的是哪一品牌。如果结果是由主观的评定,不是客观的衡量,那么评分者最好也不知道受试者是哪一组,这种方式称作双盲(double blind)。例如:病人不知道自己吃的是实验药或维生素片;同时,医生或护士也不知道病人是哪一组。总之,双重隐瞒是为了消除实验中可能的个人感情因素,以避免影响实验结果。双盲实验通常在实验对象为人类时使用,目的是避免实验的对象或进行实验的人员的主观偏向影响实验的结果,通常双盲实验得出的结果会更为严谨。在双盲实验中,受实验的对象及研究人员并不知道哪些对象属于对照组,哪些属于实验组。只有在所有资料都被收集及被分析过之后,研究人员才会知道实验对象所属组别,即为“解盲”。解盲结果,如果主要疗效指标未呈现统计学上“显著”意义,则是“解盲失败”。

实验要注意:随机性分组与双重隐瞒。

定义:调查(survey)是对总体或样本,不加以控制(control)分组,直接进行访问或观察。例如:市场问卷调查、电话访问、座谈或个人访问等都是调查。调查方式有:自我测验、访问、电话等,必要时先作测试。