首页
关于
论坛
R会
投稿
搜索
统计之都
最近更新于2024-11-10
45 / 52
统计软件
Think SAS(二)
胡江堂
/
2010-12-30
有个老本家,著有《白话文学史》(上卷)、《中国哲学史大纲》(上卷),——你知道他叫胡适。然后有朋友问这个“Think SAS”系列有没有下文,我自然不敢托大,“半卷先生”不能做,还是老老实实地把这个系列往前推吧。 第一篇“Think SAS”中的“Think”,纯粹做“考虑”解,说,诸君如果为工作计,不妨考虑下SAS。下面说些关于SAS本身的一些思考与认识。俗话说,人类一思考,上帝就拍砖。上一篇……
R会议
第三届中国R语言会议(上海会场)纪要
邱怡轩
/
2010-11-22
本文撰稿:第三届中国R语言会议(上海会场)主席张翔。 第三届中国R语言会议上海会场合影(右键另存为看大图) 第三届中国R语言会议(上海会场)于2010年11月13日~14日在上海财经大学行政楼成功召开。会议由上海财经大学统计与管理学院与统计之都网站(cos.name)协办,由 Mango Solutions 提供赞助。在两天的会议时间里,来自各行各业的R用户齐聚上海,共同探讨和交流R软件的使用经……
统计模型
假设检验初步
胡江堂
/
2010-11-14
准备再尝试一下,用大白话叙述一遍统计推断中最基础的东西(假设检验、P值、……),算是把这段时间的阅读和思考做个梳理(东西不难,思考侧重在如何表述和展示)。这次打算用一种“迂回的”表达方式,比如,本文从我们的日常逻辑推理开始说起。 […] 复习一下普通逻辑的基本思路。假设以下陈述为真: […] 你打了某种疫苗P,就不会得某种流行病Q。 […] 我们把这个先决……
统计软件
Sweave:打造一个可重复的统计研究流程
谢益辉
/
2010-11-05
警告:本文提到的工具在更新中,请暂时不要按本文的配置去做,静候LyX 2.0.3的发布。 我们都痛恨统计造假。我们都对重复性的工作感到厌倦。如果你同意这两句话或这两句话适用于你的现状,那么本文将介绍一套开源、免费的工具来克服这两个问题。当然,前提是你愿意改变,这里的工具可以让这两种现象没有藏身之地,但无法改变造假和重复劳动的现实。以下为吊胃口视频(墙外观众可以看Vimeo;墙内看不到视频的可以任选……
统计模型
强大数定律与康托三分集
左辰
/
2010-10-13
首先从博雷尔正轨数定律(Borel’s Normal Number Theorem)说起。众所周知,(0,1]区间上的每一个实数\(\omega\)都与一列唯一的无穷的二进制展开序列\(\{X_k(\omega)\}\)一一对应,其中\(X_k (\omega)\)表示二进制展开的第k位,对应关系为: $$ \omega=\sum_{k=1}^n\frac{X_k(\omega)}{2^k} $$……
机器学习
LDA主题模型简介
范建宁
/
2010-10-08
上个学期到现在陆陆续续研究了一下主题模型(topic model)这个东东。何谓“主题”呢?望文生义就知道是什么意思了,就是诸如一篇文章、一段话、一个句子所表达的中心思想。不过从统计模型的角度来说, 我们是用一个特定的词频分布来刻画主题的,并认为一篇文章、一段话、一个句子是从一个概率模型中生成的。 D. M. Blei在2003年(准确地说应该是2002年)提出的LDA(Latent……
R语言
用R也能做精算——actuar包学习笔记(二)
李皞
/
2010-09-18
本次发布的是actuar包学习笔记的第二部分。 时隔第一篇文章的发布已经一年之久,期间断断续续写了一些,也终于能拿得出一小部分成果。actuar包作为一个精算包,其处理分布的功能非常强大,因此我想不仅是精算领域,在其他应用领域需要对分布进行处理时,也可以应用这个工具。 本次更新包扩两个部分: 1)对actuar包学习笔记(一)的内容进行补充和完善,并将其按小节拆分成两个部分actuar包学习笔记(……
新闻动态
北京数据管理与生物统计论坛(BBF)第三次聚会见闻录
胡江堂
/
2010-09-05
9月4号下午,周六,去北大医学部参加了北京数据管理与生物统计论坛(Beijing Biometrics Forum, BBF)的第三次聚会,这次活动由SAS China和北京大学临床研究所赞助。这里写些会议见闻和一些零散的感想,不算是会议的正式“纪要”。东西贴这,大致想给“统计之都”(COS)的朋友交流下北京SAS技术社区的氛围、工作市场情况以及一些相关技术评论等等。 […] 西安杨……
统计模型
泊松低方差计数数据建模问题
饶燕芳
/
2010-08-28
本文作者为中国人民大学统计学院饶燕芳同学,由COS编辑部审核发表,略有修改。点击此处下载/阅读本文PDF版本 […] 在数据分析和数据建模的过程中,我们通常需要假定数据变量服从某种分布,以便于建立与分布参数有关的模型或方程,之后利用观测值对参数进行估计,从而达到研究和分析的目的。由于变量是随机的,我们无法确定变量在某个情况下的具体取值,因此通过假定它服从某个分布,然而感兴趣的只是它们……
R会议
第三届中国R语言会议(北京会场)纪要
邱怡轩
/
2010-06-23
第三届中国R语言会议北京会场合影(右键另存为看大图) 第三届中国R语言会议(北京会场)于2010年6月14日~15日在中国人民大学明德法学楼0101成功召开。会议由中国人民大学应用统计科学研究中心与中国人民大学统计学院主办、统计之都网站(cos.name)协办。在两天的会议时间里,来自各行各业的R用户齐聚北京,共同探讨和交流R软件的使用经验,取得了丰厚的成果。 […] 本次会议吸引……
统计模型
从中心极限定理的模拟到正态分布
谢益辉
/
2010-05-09
昨日翻看朱世武老师的《金融计算与建模》幻灯片(来源,幻灯片“13随机模拟基础”),其中提到了中心极限定理(Central Limit Theorem,下文简称CLT)及其SAS模拟实现。由于我一直觉得我们看到的大多数对CLT的模拟都有共同的误导性,因此在此撰文讲述我的观点,希望能说清楚CLT的真实面目,让读者对它有更深刻的理解。 […] 从广义的角度来讲,CLT说的是一些随机变量之……
统计软件
Think SAS(一)
胡江堂
/
2010-04-18
为什么你应该学SAS?本文不想卷入SAS与R,或者与SPSS、S-Plus、Matlab等统计软件孰优孰劣的争论中去,我是说,作为一个有志于投身工业界的统计分析人员,你为什么应该把SAS纳入你的分析工具箱?这会是一篇动员贴,尤其是对广大对数据分析感兴趣的在校生。在默认统计编程语言是R的“统计之都”,我需要拿上面这幅图来吸引眼球:学SAS吧。 R是好东西,不只是在COS,现在全世界的统计系和统计学……
««
«
43
44
45
46
47
»
»»