关于大数据与机器学习,小白和牛人之间15个典型问答精华整理上篇

问:不同的语言在数据处理以及算法计算过程中性能的差别是否很大?

答:就目前的经验来看,使用C或者C++的效率确实要比PYTHON高一些,但是没有差到一个数量级的差别。PYTHON程序的维护成本比C或C++感觉还是要略低一些,在生产中可以考虑用硬件数量进行弥补。

问:请问入门机器学习需要哪些基础知识呢?

答:如果想走得远,微积分、概率,这些肯定是跑不了的。 然后就可以是各种聚类分类算法,这部分还是比较好理解的,甚至没有微积分的知识也基本不影响理解。 最后是深度学习的部分,这部分说实话其实还是挺有难度的。

问:算法模型是自己建造,还是有专家开源

答: 开源的工具能解决很多问题,算法一般不用调整。但是不排除你在优化的时候根据自己的需求做修改。

这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、
爬虫、数据分析、数据可视化、机器学习等。
小编这里推荐加小编的python学习群:895,817, 687

问:目前机器学习进行到了哪个阶段? 对于软件功能的自动化测试,是否可以让机器人自己学习需求,根据设计文档来进行测试? 答:理论上确实是可行的。 不过对设计文档进行特征化的过程恐怕是个非常不确定的过程。 问题一、设计文档的标准化问题是不是做到位了?问题二、有多少样本来供训练?

训练是一个监督学习的过程,要把“文档”和“对应的测试行为”这样的关联告诉学习引擎才可以。

问:数学基础对后面的学习很重要么?我是个高数很渣的java程序员

答:数学基础对后面还是比较重要的,很多书籍里讲解算法都有数学公式推导,至少需要能看懂公式是什么意思

问:在学习前是否要复习下微积分、概率论知识?

答:边学技术边复习数学知识就行,遇到问题再去学习,不用刻意先复习一遍。

问:我做了5年的Web开发。现在就职的公司不大,数据量也才百万级。我想知道您对数据分析的理解和如何正确利用数据分析得到的结果。我想在大数据方向有所发展,希望能在学习路线上给点建议。

答:大数据的真实含义不是数据量大,而是具有丰富的数据维度。数据的价值不在于多在于能够挖掘出有价值的信息从而消除不确定性,降低试错成本。

很大一部分的数据分析是有试探性的,日常的工作中更多的是做指标涨跌的关联分析,分析好这些已经能为公司解决很多问题了。

其它方面的应用其实不一定在每个公司里都有机会去做,比如推荐系统(典型的机器学习应用场景),如果你的数据维度不足够支撑,或者业务形态不是面向大众的,那很可能无法成行。

学习路线你可以看一下这篇文章:https://my.oschina.net/ijj/blog/878119

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值