Tag Archives: Bootstrap Method

息票分离法

这个办法又叫Bootstrap Method。 什么是解鞋带取样? 解鞋带是指从一个样本里面用有放回方法取样,是在同一个样本里面取样,这个名字来源于俗语“pull up by your own bootstraps”,意思就是靠你自己的努力改变自己的境况。解鞋带取样的样本通常是研究者所持有的唯一的样本资源。解靴带取样原理是,其所用的子样本的估计量和样本的估计是相等的。 上图所示就是解靴带取样的原理图,假设你要估计你样本数据的统计精度,你就进行N次解鞋带取样(有时又称解鞋带重复取样),计算每一次解鞋带取样的统计量。这些解鞋带统计量的值被用来估计原始样本的统计量的精度。 解靴带取样方法的假设: 你的样本能有效的代表样本 解鞋带方法是从样本里面再进行有放回取样,每一次子取样都是独立同分布的,换句话说,它假设子样本和总体的分布相同,但每个样本都是和其他样本独立的。 解靴带取样的应用实例 这里有一些可以用解靴带取样方法解决的典型问题 设想你一些样本数据,但是你的样本数量很小,因而你对你样本对应的总体的理论分布不敢确定,你将如何估计四分位距,样本均值的方差。 你现在又两个不知道其分布的样本,X,Y。你想知道Z = X/Y的分布,并且得到一些其他有用的统计量(如均值和标准差)。 你有样本A,B,想知道它们是不是来自同一个总体。 你有一个回归模型,想计算参数αβ的置信区间。 解鞋带取样的数值算例 解靴带取样的核心思想,在本文前面提到,解靴带取样就是一种又放回取样,如何进行呢?假设你仅有五个观测值,你将你的观测值标记为A, B, C, D, E五个小球。 将五个球放进篮子,然后随机取出一个球,记下它的名字,然后再将球放回去,再进行下一次取样,这种取样方法就是有放回取样。这样随机重复取样,记下标签,放回小球,重复进行上千次,这记下的标签就是解靴带样本,很简单,不是么? 你的记录可能会像这样 ….., D, E, E, A, B, C, B, A, E etc. … Continue reading

Posted in 读书笔记 | Tagged | Leave a comment