数据挖掘杂谈
文章平均质量分 76
mishidemudong
菜鸟上路,一颗红心,两手准备。
展开
-
#####好好好####盘点大数据在游戏行业中的应用
伴随应用商店和社交网络的兴起,游戏市场规模空前扩大,大数据和人工智能对于游戏运营特别是延长产品寿命的积极作用越发明显。但什么样的数据有价值?如何更有效的利用数据的价值?以及人工智能具体可以将游戏行业颠覆到何种程度?都逐渐成为游戏行业共同关注的问题。那么,游戏企业可以利用大数据为自己带来些什么?大数据为游戏行业带来了哪些变革?基于玩家所产生的海量数据,我们怎样去获取玩家的具体画像、他们的特点以及预测他们未来的一些行为以服务我们的运营、发行以及研发过程中的一些系统改造?我们围绕画像展开。举个例子,.转载 2020-09-01 11:32:46 · 1236 阅读 · 0 评论 -
机器学习中的特征——特征选择的方法以及注意点
关于机器学习中的特征我有话要说 在这次校园招聘的过程中,我学到了很多的东西,也纠正了我之前的算法至上的思想,尤其是面试百度的过程中,让我渐渐意识到机器学习不是唯有算法,机器学习是一个过程,这样的过程包括数据处理+模型训练,而数据处理又包括了特征提取,特征表示。模型训练中有训练的策略,训练的模型,算法相关等等的一套流程,一个好的预测模型与特征提取,特征表示的方法息息相关,而算法这是作用于特转载 2016-11-30 11:01:43 · 1090 阅读 · 0 评论 -
时间序列分析——知乎话题讨论(收集)
1)首先尽量简化数据,让每一个输入都有很规范的格式。每一个输入源必须是mean 0,variance 1。假如说不能直接用价格;要用价格的差距。这样才可以客观比较每个输入的作用。而且很多模型本来就有这个要求。2)先排除那些没有用的输入。这很简单。把数据重新re-sample,得到两个对应的time series,A和B。算两个time series的correlation。当然这个值越大越转载 2016-11-07 13:34:42 · 2654 阅读 · 0 评论 -
如何成为数据科学家
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。作者:36大数据链接:https://www.zhihu.com/question/24855616/answer/29650667来源:知乎大数据时代,做大数据分析人员有了一个更性感的名字,叫做数据科学家。先说一个段子:一个有意思的笑话,我一哥们,以前是做数据分析的,每天很苦逼的做各种分析,拿几千转载 2015-12-28 21:03:07 · 3651 阅读 · 1 评论 -
压缩感知和深度学习的区别
本质上是两个问题。如果一定要找联系,两者都涉及数据的稀疏表达。压缩感知解决“逆问题”:Ax=b。对于欠定的线性系统,如果已知解具有稀疏性(sparsity),稀疏性可以作为约束或者正则项,提供额外的先验信息。线性逆问题和稀疏性在这类问题中的应用有相对完整的理论体系,楼上 yang liu推荐的 Michael Elad的书是很好的入门教材。另一类关系密切的问题是低秩矩阵恢复(l原创 2015-09-29 10:35:14 · 4312 阅读 · 0 评论 -
电子科大研发“学生画像”
电子科大一项研究发现,学生成绩的好坏与其行为习惯紧密相连 目前,川内各所大学即将开学。对于新入校的学生来说,大学生活该怎样合理安排?如何才能在大学里炼成一个学霸? 别担心,有大数据来告诉你!这不,由国内大数据领域的领军专家、电子科技大学教授周涛等人共同研发的“学生画像”系统,通过数据整合、分析,挖掘出每个学生的学习、生活状态,预测出学生的挂科危险以及可能出现的“特殊状况”。这个原创 2015-08-27 12:35:59 · 2377 阅读 · 0 评论 -
数据分析与数据仓库建模
第一部分 数据分析师现在已经成为了一个热门的职位,高薪的吸引力让很多先要从事这方面工作的人趋之若鹜,各种数据培训课程的开设,但是重点都是在怎么学习算法、怎么进行数据处理,怎么保证通过数据模型可以更好对数据进行数据分析。但是对于想要从事数据分析的人来说,要知道还有其他更重要的知识。第一、对于数据模型的正确认识一个好的数据模型可以帮助企业预测未来的数据,这个模型是不是有效的,能不能原创 2015-07-30 22:42:31 · 5381 阅读 · 0 评论 -
阿里云ODPS的愿景、技术实现与难点
2014年1月,阿里云将其ODPS服务开放公测。2014年4月,阿里巴巴大数据竞赛的所有参赛者将在ODPS平台上进行算法的调试、测试;同月,ODPS也将开放更高级的功能进入公测。InfoQ中文站近日跟ODPS平台的技术负责人徐常亮进行了采访,交流了有关ODPS的愿景、技术实现、实现难点等话题。InfoQ:先介绍一下ODPS现在的情况吧。这个产品能做什么?徐常亮:ODPS转载 2015-07-07 15:39:00 · 1136 阅读 · 0 评论 -
推荐算法之特征选取和业务理解的重要性
在网上看到了一些关于推荐算法的感想,都是从无数业务中结合理论升华出来的宝贵经验,在此收集在此。一、同为推荐,大不同! 不知道同学们是否经常在天猫购物,但是相信大家一定听过音乐,看过电影,读过新闻和小说。大家在享受各种娱乐信息的时候,正在被网站的后台悄悄地记录着你的信息,分析着你的偏好,然后向你推荐越来越喜欢的内容。整个过程也许你并没有明显的感知,但是你会慢慢原创 2015-07-03 09:32:19 · 2282 阅读 · 0 评论 -
ODPS技术架构及应用实践
初识ODPSODPS是分布式的海量数据处理平台,提供了丰富的数据处理功能和灵活的编程框架,主要的功能组件有如下几个。■ Tunnel服务:数据进出ODPS的唯一通道,提供高并发、高吞吐量的数据上传和下载服务。■ SQL:基于SQL92并进行了本地化扩展,可用于构建大规模数据仓库和企业BI系统,是应用最为广泛的一类服务。■ DAG编程模型:类似Hadoop MapRe转载 2015-06-23 16:18:45 · 1127 阅读 · 0 评论 -
解析阿里云大数据服务——ODPS
阿里云有许多很好的技术,比如负载均衡SLB,关系型数据库RDS,云服务器ECS,开放存储服务OSS等。如今又增加了一款重磅云服务产品:基于飞天的ODPS(Open Data Processing Service),提供数据仓库、数据挖掘和其他数据应用等功能。7月14日,阿里云计算公司总裁及阿里巴巴集团副总裁王文彬(花名菲青)为之站场,并称之为“中国进入大数据时代的里程碑”。阿里转载 2015-06-23 16:22:12 · 3911 阅读 · 0 评论