风铃系统:浅析在线调查中样本的偏差与方差
风铃系统致力于打造未来的商业操作系统,运用大数据和人工智能技术,融合行为和态度数据,帮助企业全时段聆听用户心声,全旅程改善用户体验。风铃系统推出了品牌体验、产品体验、服务体验和员工体验组成的CEM产品矩阵,为企业、政府、高校和个人提供问卷设计、样本收集、建模分析、决策建议等一站式解决方案。
那么,接下来风铃系统跟大家一起聊聊:在线调查中样本的偏差和方差是如何产生的?
一、偏差与方差(biasversusvariance)
如果样本在某种程度上不能从系统上代表所推断的总体,那么所得到的分析可能会产生偏差。例如,对互联网用户进行的有关电脑使用情况的调查结果不可能准确量化一般人群的电脑使用情况,因为样本仅由使用电脑的人组成。此外,应当认识到,采集更大的样本并不能自然而然的纠正偏差,大样本也不能证明偏差就小。例如,不管调查了多少互联网用户,根据互联网用户样本所估计的电脑平均使用率都很可能会高估总体人口的平均使用率。
随机化是指从感兴趣的总体中随机选择受访者,该方法可最大程度地减少偏差的几率。其想法是,通过从整个总体中随机选择潜在的调查对象,抽样得到的样本将很可能“看起来像”总体,即使对于那些无法观测或未知的特征。后一点值得强调,概率样本对于可观测和不可观测特征(observableandunobservablecharacteristics)均可降低抽样偏差的机会。
另一方面,方差只是观测数据变化的度量,可用于计算标准误差。通过概率抽样机制得出统计估计值的精度可通过增大样本量来提高,因为(在所有其他条件保持不变的情况下)更大的样本量可带来更小的标准误差。
二、偏差的一些重要来源
偏差可以通过多种方式影响调查结果。在不存在明显的无应答的情况下,基于概率的抽样是尽可能减少偏差的最佳方法。另一方面,通常认为方便抽样生成偏差样本的可能性更高。但是,即使采用随机方法,对于人的调查也可能会受制于其他类型的偏差。例如,受访者可能倾向于夸大或低估某些事物(“sensitivitybias”),特别是对一些微妙、敏感的问题。在这里,我们仅关注与抽样相关的一些更常见的偏差来源。
1.抽样框覆盖偏差(framecoveragebias)。当抽样框遗漏了总体的某些重要部分时会发生抽样框覆盖偏差。例如,使用电子邮件地址列表进行的电子邮件调查将遗漏那些没有电子邮件的人。
2.选择偏差(selectionbias)是由个体或单元被选入调查的方式带来的误差。例如,如果是否参与调查取决于受访者能否使用特定设备(在线调查会漏掉无法上网的人),选择偏差就会发生。
当某些单元比其他单元更有机会被抽中时,会发生sizebias。例如,在网站访问者的系统样本中,网站的频繁访问者更容易被抽中。同样,从包含电子邮件地址的抽样框中进行选择时,具有多个电子邮件的人更有可能被选为样本。
3.无应答偏差(Nonresponsebias)。如果拒绝应答调查的人与应答的人具有系统差异,则会出现无应答偏差。
以上便是风铃系统为读者朋友带来的相关内容介绍,希望对大家有所帮助,感谢阅读!