首页
关于
论坛
R会
投稿
搜索
机器学习
最近更新于2024-07-09
1 / 4
统计计算
挑战最快 SVM!ReHLine 算法诞生记
邱怡轩
/
2023-12-22
本文由邱怡轩主笔,内容素材源自邱怡轩和戴奔共同讨论的结果。 […] 武林至尊,宝刀屠龙。长久以来,机器学习江湖中一直流传着两件神器——LibSVM 和 Liblinear,它们都是用来求解支持向量机(SVM)问题的,且都是由台湾大学的林智仁教授及其团队开发和维护。两者的不同在于,LibSVM 支持各类基于核函数的 SVM,而 Liblinear 只能计算线性 SVM。但从计算效率上来……
机器学习
给初学者准备的 R 语言深度学习教程
庄亮亮
/
2022-05-21
近年来深度学习在人工智能领域飞速发展,各行业的学者、研究人员纷纷涌入研究热潮。本文将从 R 语言角度来介绍深度学习并解决以下几个问题: […] 并在文末给出一些学习资料供大家参考、学习。 […] 深度学习是机器学习领域一个新的研究方向,通过模型模拟人类大脑的神经连接结构,进而给出数据的解释。图 1 给出了人工智能、机器学习和深度学习三者的关系。 深度学习之所以被称为 “……
机器学习
基于深度学习和迁移学习的识花实践
罗大钧
/
2017-10-16
深度学习是人工智能领域近年来最火热的话题之一,但是对于个人来说,以往想要玩转深度学习除了要具备高超的编程技巧,还需要有海量的数据和强劲的硬件。不过TensorFlow和Keras等框架的出现大大降低了编程的复杂度,而迁移学习的思想也允许我们利用现有的模型加上少量数据和训练时间,取得不俗的效果。 这篇文章将示范如何利用迁移学习训练一个能从图片中分类不同种类的花的模型,它在五种花中能达到80%以上的准……
机器学习
为什么统计学家也应该学学 TensorFlow
邱怡轩
/
2017-08-22
(先啰嗦一句:本文的标题和内容牵涉到 TensorFlow,只是因为它是可用的工具之一,我相信很多其他的框架都可以做到文中我想要实现的功能。我自己并没有工具上的偏好,所以就当是拿 TensorFlow 举一个例子。) 对于学统计做统计的人来说,这可能是最好的时代,也可能是最坏的时代。好的地方我就不多说了,基本上关键词包括“大数据”、“数据科学”等,搜索引擎可以帮你列举出许多激动人心的字眼。为什么会……
统计应用
十行代码预测插旗西雅图
侯澄钧
/
2017-05-19
我错了,我承认我是标题党,怎么可能用十行代码完成 Dota2 信仰2 比赛数据的抓取, 清洗与预测建模呢。 不过为了发扬继承郎大为“十行代码”系列的优良传统,我决定沿用这个名字,希望能把品牌做大做强,走出亚洲,面向世界。。。 事情的起因是这样的:上周与同为信仰粉的大为接上头之后,被安利了一个叫 RDota2 的 R pacakge。 这个工具包使用 Steam API,可以让 R……
统计应用
热门数据挖掘模型应用入门(一): LASSO回归
侯澄钧
/
2016-10-10
Kaggle网站(https://www.kaggle.com/)成立于2010年,是当下最流行的进行数据发掘和预测模型竞赛的在线平台。 与Kaggle合作的公司可以在网站上提出一个问题或者目标,同时提供相关数据,来自世界各地的计算机科学家、统计学家和建模爱好者, 将受领任务,通过比较模型的某些性能参数,角逐出优胜者。 通过大量的比赛,一系列优秀的数据挖掘模型脱颖而出,受到广大建模者的认同,被普遍……
统计应用
标题党统计学
邱怡轩
/
2016-07-02
如果你是被这个标题骗进来的,那么说明标题党的存在的确是有原因的。 在网络高度发达(以及“大数据”泛滥)的今天,数据动不动就是以 GB 和 TB 的级别存储,然而相比之下,人类接受信息的速度却慢得可怕(参见大刘《乡村教师》)。 试想一下,你一分钟能阅读多少文字?一千?五千?总之是在 KB 的量级。 所以可以说,人们对文字的“下载速度”基本上就是 1~10KB/min。如果拿这个速度去上网的话你还能……
机器学习
浅谈深度学习中潜藏的稀疏表达
汪张扬
/
2016-06-24
“王杨卢骆当时体,轻薄为文哂未休。 尔曹身与名俱灭,不废江河万古流。” — 唐 杜甫《戏为六绝句》(其二) […] 【不要问我为啥放这首在开头,千人千面千理解吧】 […] 深度学习(DL),或说深度神经网络(DNN),作为传统机器学习中神经网络(NN)、感知机(perceptron)模型的扩展延伸,正掀起铺天盖地的热潮。DNN火箭般的研究速度,在短短数年内带来了能“读……
推荐文章
张志华教授:机器学习——统计与计算之恋
张志华
/
2016-06-23
编辑部按:本文是从张志华老师在第九届中国R语言会议和上海交通大学的两次讲座中整理出来的,点击此处观看幻灯片。张志华老师是上海交通大学计算机科学与工程系教授,上海交通大学数据科学研究中心兼职教授,计算机科学与技术和统计学双学科的博士生指导导师。在加入上海交通大学之前,是浙江大学计算机学院教授和浙江大学统计科学中心兼职教授。张老师主要从事人工智能、机器学习与应用统计学领域的教学与研究,迄今在国际重要学……
机器学习
基于机器学习的高价值用户自动发现
迟保昉 / 苏铖 / 单艺
/
2016-05-22
作者:迟保昉(猎聘大数据研究院) 苏铖(猎聘大数据研究院) 单艺(猎聘大数据研究院) 摘要:猎聘每天有数万新用户注册。但是,其中有的用户只是填写了少量的职业信息,即名片信息,而并未完成整个简历的填写。为获得完整的简历,猎聘职业顾问团队(GCDC)需要电话联系该部分用户完善简历。历史数据表明,未填写简历的用户中有相当数量的高价值的用户,而猎聘职业顾问需要能够优先拨打这批高级用户并提升其转化率。 为……
机器学习
COS每周精选:机器学习
冯凌秉 / 王威廉 / 王小宁
/
2016-05-01
本期投稿:冯凌秉 王威廉 王小宁 […] 非平衡样本的分类问题是机器学习的经典问题之一,困扰着不少童鞋。这篇博文提供在R中解决该问题的实用指南。 Github上比较受欢迎的深度学习项目(Top Deep Learning Projects),按照获得星星个数的排名,包括一些教程项目等。 学习完这个,基本上就可以闯荡天涯啦! 机器学习顶级会议ICML2016论文赏析:deep……
机器学习
mxnet:结合R与GPU加速深度学习
何通
/
2016-04-07
近年来,深度学习可谓是机器学习方向的明星概念,不同的模型分别在图像处理与自然语言处理等任务中取得了前所未有的好成绩。在实际的应用中,大家除了关心模型的准确度,还常常希望能比较快速地完成模型的训练。一个常用的加速手段便是将模型放在GPU上进行训练。然而由于种种原因,R语言似乎缺少一个能够在GPU上训练深度学习模型的程序包。 DMLC(Distributed (Deep) Machine……
««
«
1
2
3
4
»
»»