首页
关于
论坛
R会
投稿
搜索
推荐文章
最近更新于2024-11-10
9 / 10
推荐文章
支持向量机系列四:Outliers
张驰原
/
2014-02-22
原文链接请点击这里 在最开始讨论支持向量机的时候,我们就假定,数据是线性可分的,亦即我们可以找到一个可行的超平面将数据完全分开。后来为了处理非线性数据,使用 Kernel 方法对原来的线性 SVM 进行了推广,使得非线性的的情况也能处理。虽然通过映射\(\phi(\cdot)\)将原始数据映射到高维空间之后,能够线性分隔的概率大大增加,但是对于某些情况还是很难处理。例如可能并不是因为数据本身是非线……
推荐文章
支持向量机系列三:Kernel
张驰原
/
2014-02-17
原文链接请点击这里 前面我们介绍了线性情况下的支持向量机,它通过寻找一个线性的超平面来达到对数据进行分类的目的。不过,由于是线性方法,所以对非线性的数据就没有办法处理了。例如图中的两类数据,分别分布为两个圆圈的形状,不论是任何高级的分类器,只要它是线性的,就没法处理,SVM 也不行。因为这样的数据本身就是线性不可分的。 对于这个数据集,我可以悄悄透露一下:我生成它的时候就是用两个半径不同的圆圈加……
推荐文章
支持向量机系列二: Support Vector
张驰原
/
2014-01-25
原文链接请点击这里 上一次介绍支持向量机,结果说到 Maximum Margin Classifier ,到最后都没有说“支持向量”到底是什么东西。不妨回忆一下上次最后一张图: 可以看到两个支撑着中间的 gap 的超平面,它们到中间的 separating hyper plane 的距离相等(想想看:为什么一定是相等的?),即我们所能得到的最大的 geometrical margin……
推荐文章
支持向量机系列一: Maximum Margin Classifier
张驰原
/
2014-01-23
原文链接请点击这里 支持向量机即 Support Vector Machine,简称 SVM 。我最开始听说这头机器的名号的时候,一种神秘感就油然而生,似乎把 Support 这么一个具体的动作和 Vector 这么一个抽象的概念拼到一起,然后再做成一个 Machine ,一听就很玄了! 不过后来我才知道,原来 SVM 它并不是一头机器,而是一种算法,或者,确切地说,是一类算法,当然,这样抠字眼的……
推荐文章
从数据到价值——创业团队应该关注的四个阶段
王汉生
/
2014-01-03
COS编辑部按:本文作者为北京大学王汉生教授,文章面向光华MBA学生系统梳理了从数据到价值的理念。作者简介:王汉生教授现任狗熊会会长、北京大学商务智能研究中心主任、北京大学光华管理学院商务统计与经济计量系系主任。现为ISI, ASA, IMS, RSS, ICSA会员,ASA会士(2014年6月23日更新)。 […] 这是一个最好的时代,移动互联网技术为从业者提供了无比丰富的数据。从……
推荐文章
use R for fun系列之玩转图像篇
刘辰昂
/
2013-09-01
系列以use R for fun为主题,以COS论坛上的精华帖、相关package以及自己的一些code为素材,结合自身的一些编程体会,从而整合成文。本文是第三篇玩转图像篇。 本文素材出处均已在正文中注明 接着for fun的话题往下讲,大家或多或少都曾经用过PS来玩过图片,其强大的功能令我们不得不赞叹,无论是美图还是是恶搞都曾给我们带来了不少的乐趣。今天我们就要让这种乐趣在万能的R中实现!当然实……
推荐文章
COS论坛精华帖系列——use R for fun系列之小应用制作篇
刘辰昂
/
2013-08-10
系列以use R for fun为主题,以COS论坛上的精华帖、相关的package以及自己的一些code为素材,结合自身的一些编程体会,从而整合成文。本文是第二篇小应用制作篇。 本文素材出处均已在正文注明 本文继续承接上一篇的话题(小游戏开发篇),继续在交互操作上做文章,不同的是这里引入了更丰富的操作和idea,仅仅做些小游戏还远远达不到我们的胃口,因此这里不妨再把思维拓宽些,让R来我们的生活服……
推荐文章
COS论坛精华帖系列——use R for fun系列之小游戏开发篇
刘辰昂
/
2013-08-08
系列以use R for fun为主题,以COS论坛上的精华帖、相关的package以及自己的一些code为素材,结合自身的一些编程体会,从而整合成文。 很多人都片面的认为R仅仅是一个自由免费的统计分析软件,加之其没有其他商业软件诸如SAS、SPSS等商业软件友好的界面而并不被很多人所喜爱,但事实上这非常片面,因此本文旨在通过一系列看似不务正业但实则蕴含一定R语言使用技巧的内容纠结部分user对R……
推荐文章
大数据时代和数据分析需求,统计还沾边吗?
施涛
/
2013-05-29
本文转载自施涛的博客,原文链接请点击此处。 […] 大数据时代的悄然到来和计算能力爆炸式增长,让做统计分析的各类人士不禁要重新打量一下自己的技能包,看看是不是很快要被时代浪潮以大浪淘沙的方式清洗掉了。 到底大数据是怎么来的呢?可以用来干什么呢?我们就先拿2012美国总统大选来举个例子看看。比如说我们想预测在2012年11月6日, […] 我们可以用什么数据来做这个预测……
推荐文章
[译作]一些统计名词的新名字
Larry Wasserman
/
2012-12-18
原文载于卡耐基梅隆大学统计系教授Larry Wasserman的博客:Normal Deviate 有没有觉得很多统计学家实在是想象力有限——是时候把那些迂腐无趣的名字踢出历史了!看看这些如何? 贝叶斯推断:虽然贝叶斯当年确实用他那个著名的定理来做了一些计算…但明明是拉普拉斯搞出来的系统推断好不好! 新名字:拉普拉斯推断 贝叶斯网络:一个有向无环图加上了一些概率分布就可以跟贝叶斯推断扯上亲戚了?或……
推荐文章
关于概率论主干课程的训练
周达
/
2012-04-15
虽然外界不大能区分“概率论”和“统计学”的差别,但是在概率统计专业内的人士们看来,这两者无论从思维方式、课程学习还是学术训练角度来看,区别还是相当明显的。比如我了解的北大概率统计系的情况,概率论和数理统计分属不同的教研室,日常的学术活动也大相径庭。研究生除了第一年会一起上专业基础课之外,之后就少有交集。我当年的体会是,在统计专业同学们的眼中,“概率论跟基础数学没有什么区别”;而在概率专业的同学看……
推荐文章
25年后的统计系会是什么样?
Leo Breiman
/
2012-02-21
本文是统计学家Leo Breiman1994年在加州伯克利统计系毕业典礼上的讲话,原文请参考此处。 中文译稿可参见施涛博客,本文对其进行了修改和润色。 Leo Breiman简介:加州伯克利统计系教授,美国国家科学院院士,20世纪伟大的统计学家,囊括多项统计领域大奖。机器学习先驱者,分类回归树作者之一,Bagging方法发明者,对模式识别领域有巨大贡献。于2005年逝世。更多信息可参考此处和此处。……
««
«
6
7
8
9
10
»
»»