首页
关于
论坛
R会
投稿
搜索
推荐文章
最近更新于2024-11-10
8 / 10
推荐文章
数据科学中的“数据智慧”
郁彬
/
2015-05-21
原文链接:http://www.odbms.org/2015/04/data-wisdom-for-data-science/ 本文得到了原英文作者郁彬的授权同意,由吕翔和张心雨翻译、施涛和高涛审校。感谢他们的支持和帮助。 在大数据时代,学术界和业界的大量研究都是关于如何以一种可扩展和高效率的方式来对数据进行储存,交换和计算(通过统计方法和算法)。这些研究领域无疑非常重要,然而,只有当我们对数据智……
推荐文章
Data(动词)
Edward Shepard
/
2015-05-12
原文地址:https://medium.com/@blprnt/data-v-da0e0d24777c 作者:Edward Shepard 翻译:腊八粥 本文是翻译,版权归原作者所有 […] 让我们把 data 变成动词吧。 我 data 你,你 data 我。他们 data 我们,我们 data 他们。 当你的简明牛津词典跨过屋子向我飘来时,我们还是花些时间来考虑下面的说法:……
推荐文章
浅谈医学大数据(中)
陈遵秋
/
2015-03-23
本文作者陈遵秋,美国俄勒冈州,健康科技大学,公共卫生预防系,美国统计协会认证统计分析师;陈漪伊,美国俄勒冈州,健康科技大学,公共卫生预防系,生物统计助理教授(交流微信号:2823095726) […] 医疗大数据有着前面第一节提到的所有特征。在医疗大数据带来各种优势的同时,大数据随之带来的各种特性使得传统的数据处理和数据分析方法及软件捉襟见肘,问题多多。在大数据时代出现之前,受限于数……
推荐文章
浅谈医学大数据(上)
陈遵秋
/
2015-03-22
本文作者陈遵秋,美国俄勒冈州,健康科技大学,公共卫生预防系,美国统计协会认证统计分析师;陈漪伊,美国俄勒冈州,健康科技大学,公共卫生预防系,生物统计助理教授(交流微信号:2823095726) […] 现在无论国内外均出现了移动医疗热,所有的创业团队和投资公司均把商业模式指向了最后的医疗大数据分析。但是可以很负责任的说,90% 以上的人都不知道医疗大数据分析是什么东西,因此这是一篇扫……
推荐文章
一个数据分析师的博客正在改变着纽约人看待城市的方式
腊八粥
/
2014-12-22
本文摘自:腊八粥 原文:http://www.labazhou.net/2014/12/a-data-analysts-blog-is-transforming-how-new-yorkers-see-their-city/ Ben Wellington因为这个消防栓而被鉴定为纽约“开放数据”运动之王。今年早些时候,Wellington钻研了纽约市的违章停车罚单的数据,识别出连续街区的两个消防栓一……
推荐文章
郁彬:让我们拥抱数据科学(Let us own data science)
郁彬
/
2014-09-15
郁彬教授8月22日在北京大学做了名为**让我们拥抱数据科学(Let us own data science)**的讲座。在演讲中郁彬从一个统计学家的角度出发,讲述了数据科学的兴起历史和目前状况,并且对统计学科、从事统计相关工作的人士如何跟上时代步伐拥抱数据科学给出了非常多的建议。经过郁彬的允许和支持,本文分享了她此次演讲的幻灯片和视频! 演讲人介绍:郁彬是加州大学伯克利分校统计系和电子工程与计算机……
推荐文章
诲人以心
蔡知令
/
2014-06-28
在过去的10年里,我们目睹了许多显赫的商人做出了愚蠢和冒险的决策,这些决策对全球经济和个人投资者都造成了严重的损失。例如在去年,一名摩根大通的无良交易员因为投资某些隐晦且复杂的金融衍生品而损失了58亿美元。随着这类行为变得越来越常见,大众已不再相信商业和金融机构能为他们的行为负责,这种不信任的情绪也损害了商学院以及那些获得MBA学位毕业生们的声誉。 如何解决这些问题呢?我个人坚信,如果那些商学院的……
推荐文章
[朝花夕拾] 迎接信息时代的统计挑战
施涛
/
2014-05-14
本文略有修改,原文请点击此处 本文作者为俄亥俄州立大学的施涛。他把自己读郁彬老师的综述性文章:Embracing Statistical Challenges in the Information Technology Age的读后感和大家分享。 世事变迁,最近居然忽然有时间坐下来读些东西,重新审视一下这几年统计领域的发展了。粗略回想了一下,惭愧地发现我好像连博士导师的文章也没有系统地读过几篇,只……
推荐文章
“支持向量机系列”的番外篇二: Kernel II
张驰原
/
2014-05-08
原文链接请点击这里 在之前我们介绍了如何用 Kernel 方法来将线性 SVM 进行推广以使其能够处理非线性的情况,那里用到的方法就是通过一个非线性映射 $\phi(\cdot)$将原始数据进行映射,使得原来的非线性问题在映射之后的空间中变成线性的问题。然后我们利用核函数来简化计算,使得这样的方法在实际中变得可行。不过,从线性到非线性的推广我们并没有把 SVM 的式子从头推导一遍,而只是直接把最终……
推荐文章
昔日因,今日意
杨灿
/
2014-04-19
飞帅云:“三十功名尘与土,八千里路云和月。莫等闲,白了少年头,空悲切。”可我在耶鲁两年多了,基本一事无成。既没有像当年那样死磕Lasso和Boosting,也没有能追随Deep Learning 的浪潮。曾经真的以为人生就这样了,平静的心拒绝再有浪潮。斩了千次的情丝却断不了,百转千折她将我围绕。有人问我她究竟是哪里好?我想我是鬼迷心窍。 […] 她就是LMM,我给她起了一个美丽的中文……
推荐文章
“支持向量机系列”的番外篇一: Duality
张驰原
/
2014-03-19
原文链接请点击这里 在之前关于support vector的推导中,我们提到了dual,这里再来补充一点相关的知识。这套理论不仅适用于 SVM 的优化问题,而是对于所有带约束的优化问题都适用的,是优化理论中的一个重要部分。简单来说,对于任意一个带约束的优化都可以写成这样的形式: $$ \begin{aligned} \min&f_0(x) \\ s.t. &f_i(x)\leq……
推荐文章
支持向量机系列五:Numerical Optimization
张驰原
/
2014-03-06
原文链接请点击这里 作为支持向量机系列的基本篇的最后一篇文章,我在这里打算简单地介绍一下用于优化 dual 问题的 Sequential Minimal Optimization (SMO) 方法。确确实实只是简单介绍一下,原因主要有两个:第一这类优化算法,特别是牵涉到实现细节的时候,干巴巴地讲算法不太好玩,有时候讲出来每个人实现得结果还不一样,提一下方法,再结合实际的实现代码的话,应该会更加明……
««
«
6
7
8
9
10
»
»»