`
cloudeagle_bupt
  • 浏览: 538025 次
文章分类
社区版块
存档分类
最新评论

BootStrap思想

 
阅读更多

一句话,讲白了就是对已有的观测样本反复的有放回抽样,通过多次计算这些放回抽样的结果,获取统计量的分布。


以下是收集的一些例子:

1979年美国Stanford大学统计系教授Bradley Efron[1]在总结、归纳前人研究成果的基础上提出一种新的非参数统计方法——Bootstrap方法,1980年魏宗舒教授向国内做了首次介绍并将Bootstrap译作“自助法”。Bootstrap方法是一类非参数Monte Carlo方法,其实质是对观测信息进行再抽样,进而对总体的分布特性进行统计推断。 Bootstrap方法因为充分利用了给定的观测信息,不需要模型其他的假设和增加新的观测,并且具有稳健性和效率高的特点,越来越受到欢迎。


基本思想:重抽样

我们有观测数据集

<nobr style=""><span class="math" id="MathJax-Span-1" style=""><span style=""><span style=""><span class="mrow" id="MathJax-Span-2" style=""><span class="mi" id="MathJax-Span-3" style="">D</span><span class="mo" id="MathJax-Span-4" style="">:</span><span class="mo" id="MathJax-Span-5" style="">{</span><span class="mo" id="MathJax-Span-6" style="">(</span><span class="msubsup" id="MathJax-Span-7" style=""><span style=""><span style=""><span class="mi" id="MathJax-Span-8" style="">x</span><span style=""></span></span><span style=""><span class="texatom" id="MathJax-Span-9" style=""><span class="mrow" id="MathJax-Span-10" style=""><span class="mi" id="MathJax-Span-11" style="">i</span></span></span><span style=""></span></span></span></span><span class="mo" id="MathJax-Span-12" style="">,</span><span class="msubsup" id="MathJax-Span-13" style=""><span style=""><span style=""><span class="mi" id="MathJax-Span-14" style="">y<span style=""></span></span><span style=""></span></span><span style=""><span class="texatom" id="MathJax-Span-15" style=""><span class="mrow" id="MathJax-Span-16" style=""><span class="mi" id="MathJax-Span-17" style="">i</span></span></span><span style=""></span></span></span></span><span class="mo" id="MathJax-Span-18" style="">)</span><span class="mo" id="MathJax-Span-19" style="">,</span><span class="mn" id="MathJax-Span-20" style="">1</span><span class="mo" id="MathJax-Span-21" style="">≤</span><span class="mi" id="MathJax-Span-22" style="">i</span><span class="mo" id="MathJax-Span-23" style="">≤</span><span class="mi" id="MathJax-Span-24" style="">N<span style=""></span></span><span class="mo" id="MathJax-Span-25" style="">}</span></span><span style=""></span></span></span><span style=""></span></span></nobr>
,然后对这N个样本,进行有放回的重抽样。每轮我们还是抽N个,然后一共抽B轮(比如几百轮,话说前几天weibo上有人问“如果给你一万个人,你要做什么”,放在这里我就要他们不停的抽小球抽小球抽小球,哈哈!)。这样就得到了新的观测样本
<nobr style=""><span class="math" id="MathJax-Span-26" style=""><span style=""><span style=""><span class="mrow" id="MathJax-Span-27" style=""><span class="msubsup" id="MathJax-Span-28" style=""><span style=""><span style=""><span class="mi" id="MathJax-Span-29" style="">D</span><span style=""></span></span><span style=""><span class="texatom" id="MathJax-Span-30" style=""><span class="mrow" id="MathJax-Span-31" style=""><span class="mi" id="MathJax-Span-32" style="">b</span></span></span><span style=""></span></span></span></span><span class="mo" id="MathJax-Span-33" style="">:</span><span class="mo" id="MathJax-Span-34" style="">{</span><span class="mo" id="MathJax-Span-35" style="">(</span><span class="msubsup" id="MathJax-Span-36" style=""><span style=""><span style=""><span class="mi" id="MathJax-Span-37" style="">x</span><span style=""></span></span><span style=""><span class="texatom" id="MathJax-Span-38" style=""><span class="mrow" id="MathJax-Span-39" style=""><span class="mi" id="MathJax-Span-40" style="">b</span></span></span><span style=""></span></span><span style=""><span class="texatom" id="MathJax-Span-41" style=""><span class="mrow" id="MathJax-Span-42" style=""><span class="mi" id="MathJax-Span-43" style="">i</span></span></span><span style=""></span></span></span></span><span class="mo" id="MathJax-Span-44" style="">,</span><span class="msubsup" id="MathJax-Span-45" style=""><span style=""><span style=""><span class="mi" id="MathJax-Span-46" style="">y<span style=""></span></span><span style=""></span></span><span style=""><span class="texatom" id="MathJax-Span-47" style=""><span class="mrow" id="MathJax-Span-48" style=""><span class="mi" id="MathJax-Span-49" style="">b</span></span></span><span style=""></span></span><span style=""><span class="texatom" id="MathJax-Span-50" style=""><span class="mrow" id="MathJax-Span-51" style=""><span class="mi" id="MathJax-Span-52" style="">i</span></span></span><span style=""></span></span></span></span><span class="mo" id="MathJax-Span-53" style="">)</span><span class="mo" id="MathJax-Span-54" style="">,</span><span class="mn" id="MathJax-Span-55" style="">1</span><span class="mo" id="MathJax-Span-56" style="">≤</span><span class="mi" id="MathJax-Span-57" style="">i</span><span class="mo" id="MathJax-Span-58" style="">≤</span><span class="mi" id="MathJax-Span-59" style="">N<span style=""></span></span><span class="mo" id="MathJax-Span-60" style="">}</span><span class="mo" id="MathJax-Span-61" style="">,</span><span class="mspace" id="MathJax-Span-62" style=""></span><span class="mn" id="MathJax-Span-63" style="">1</span><span class="mo" id="MathJax-Span-64" style="">≤</span><span class="mi" id="MathJax-Span-65" style="">b</span><span class="mo" id="MathJax-Span-66" style="">≤</span><span class="mi" id="MathJax-Span-67" style="">B</span></span><span style=""></span></span></span><span style=""></span></span></nobr>


Bootstrap的思想,是生成一系列bootstrap伪样本,每个样本是初始数据有放回抽样。通过对伪样本的计算,获得统计量的分布。例如,要进行1000次bootstrap,求平均值的置信区间,可以对每个伪样本计算平均值。这样就获得了1000个平均值。对着1000个平均值的分位数进行计算, 即可获得置信区间。已经证明,在初始样本足够大的情况下,bootstrap抽样能够无偏得接近总体的分布。



分享到:
评论

相关推荐

    Bootstrap期末作品

    整体运用了栅格系统布局,局部应用了固定到顶部的导航栏组件,下拉菜单组件,轮播图插件,以及Bootstrap自带的按钮样式。希望通过学习Bootstrap从这种布局的思想,实现的方式中加深对CSS html 的理解

    bootstrap再抽样方法的SAS程序设计

    介绍bootstrap抽样的思想及运用SAS标准统计软件进行操作

    论文研究-基于改进Bootstrap和BayesianBootstrap的小样本产品实时性能可靠性评估.pdf

    为此,提出了基于改进Bootstrap(改进自助法)仿真和Bayesian Bootstrap(随机加权法)仿真的 小样本产品实时性能可靠性评估新方法。这两种方法均是通过数字仿真技术扩大样本量,该方法完全依赖于样 品本身的数据,...

    Bootstrap.pdf

    主要介绍了统计学中累计分布函数和Bootstrap方法。 (1)累积分布函数与分布函数的关系 (2)如何利用累积分布函数...(3)Bootstrap方法的基本思想 (4)Bootstrap方法的实现算法 (5)利用Bootstrap方法构造置信区间

    深入理解bootstrap

    Bootstrap是目前全球最流行、最火爆的Web前端开发框架...有一定Bootstrap经验的专业前端开发工程师,书中对Bootstrap架构思想的阐述、实现原理的分析、扩展和插件的二次开发能让他们自如解决开发中遇到的各种疑难问题。

    深入理解Bootstrap

    Bootstrap是目前全球最流行、最火爆的Web前端开发框架...有一定Bootstrap经验的专业前端开发工程师,书中对Bootstrap架构思想的阐述、实现原理的分析、扩展和插件的二次开发能让他们自如解决开发中遇到的各种疑难问题。

    深入理解Bootstrap (Web开发技术丛书) - 徐涛(带目录高清版)

    有一定Bootstrap经验的专业前端开发工程师,书中对Bootstrap架构思想的阐述、实现原理的分析、扩展和插件的二次开发能让他们自如解决开发中遇到的各种疑难问题。如有侵权请联系/留言下架,上传实乃原版超清书籍。

    bootstrap4-api-plugin:提供Bootstrap 4的Jenkins插件

    开发人员可以使用他们的Sass变量和mixins,响应式网格系统,大量的预构建组件以及基于jQuery构建的强大插件,快速构建其思想原型或构建整个应用程序。 该插件捆绑了最新版本和相应的Jenkins UI元素。请注意,...

    基于Co-Training策略的视频广告文本检测 (2010年)

    另外,针对Co-training协同学习机制中容易引入噪声样本的问题,提出了一种改进的结合Bootstrap思想的Co-training算法,在两个相对独立的特征空间中交互选择典型样本,以达到提高分类器泛化能力的目的.通过实验,本...

    Java源码 SpringMVC Mybatis Shiro Bootstrap Rest Webservice

    项目Maven构建,真实大型互联网架构,做到高并发,大数据处理,整个项目使用定制化服务思想,提供模块化、服务化、原子化的方案,将功能模块进行拆分,可以公用到所有的项目中。架构采用分布式部署架构,所有模块...

    深入理解Bootstrap.pdf

    《深入理解Bootstrap》一书是资深Web技术专家经验结晶,根据Bootstrap最新版本撰写,内容系统、分析深入、实战性强,前端工程师必备;授人以鱼,全面讲解各功能组件的使用方法,以及对现有插件和扩展的二次开发;授...

    Bootstrap整体框架之CSS12栅格系统

    1.整体架构 BootStrap框架公共六个部分:(css组件和js插件是其表现形式,其余的是基础支撑平台) ...1.最外层的边框,伴随着响应式思想,区分了四种类型浏览器,像素分界点768px、992px、1200px 2.第二层的边框,即

Global site tag (gtag.js) - Google Analytics