在大学-数据分析
王凯2012
浙江人士,2012年入学电子科技大学
展开
-
什么是数据科学家
二、数据科学家的定义数据科学(Data Science)是从数据中提取知识的研究,关键是科学。数据科学集成了多种领域的不同元素,包括信号处理,数学,概率模型技术和理论,机器学习,计算机编程,统计学,数据工程,模式识别和学习,可视化,不确定性建模,数据仓库,以及从数据中析取规律和产品的高性能计算。数据科学并不局限于大数据,但是数据量的扩大诚然使得数据科学的地位越发重要。转载 2014-06-20 20:14:42 · 835 阅读 · 0 评论 -
机器学习模型的11个要点
【原题】A Few Useful Things to Know About Machine Learning【译题】机器学习的那些事【作者】Pedro Domingos【译者】刘知远【说明】译文载于《中国计算机学会通讯》 第 8 卷 第 11 期 2012 年 11 月 ,本文译自Communications of the ACM 2012年第10期的“A Few Useful T转载 2015-02-25 08:40:52 · 1188 阅读 · 0 评论 -
数学建模之机理分析、统计分析、层次分析
//2015年5月2日数学建模书籍有一些章节是让人搞不懂的,人们可以接受排队论,最优化,线性规划等等技术型的学科,但对机理分析、层次分析这些既搞不懂,也不认为有什么意义。(我个人的写照)。主要是书上都没有讲清楚这个概念:一、机理分析用经典的数学工具分析现象的因果关系。什么是经典的数学工具:人口模型(增长速率先上升后下降),相变(物理上概念,用在模型上即是某些重要指标突变),博弈原创 2015-05-02 12:48:58 · 7880 阅读 · 0 评论 -
阿里天池大数据竞赛(杂)
//2015年4月30日//未完成预处理:刷点击用户重复记录一、模型跑不出分层,我们自己来分层模型一:预测重复购买的 18/12548模型二:对已买过的商品 43/43720模型三:对已交互的,新品 124/302800模型四:前一天加购物车的 51/1027二、正例从何而来全正例三、业务熟练发现加很多购物车的用户原创 2015-04-30 13:04:02 · 1487 阅读 · 0 评论 -
阿里天池大数据竞赛(一)用ODPS提取特征
//2015年4月30日提取特征之所以难,是因为我们写出的sql语句往往只能提取一个特征。而在ODPS上却不一样,一条语句可以提取很多特征。如提取最近1、2、3、4天四种行为的数量重点是decode函数,具体用法详见ODPS-sql文档int days[]={0,-1,-2,-3}; String sql="create table if not exists user_原创 2015-04-30 12:04:59 · 1650 阅读 · 0 评论