数据科学家日记
文章平均质量分 75
leoxiao2012
无
展开
-
【2016-07-12】第一周
xgboost原创 2016-07-12 10:25:07 · 214 阅读 · 0 评论 -
学习回顾和展望
回顾编程语言Python基础数据结构,面向对象,numpy数据结构用Python实现linkedlist, expression tree, heap算法最长回文子串(manacher算法),基本排序,动态规划(0/1背包问题)机器学习数学计算机基础大数据技术展望SVM,神经网络的原理,最优化理论基础,pandas,scipy,scikit-learn,matplotlib原创 2016-10-27 23:48:43 · 449 阅读 · 0 评论 -
最优化算法实践
学习资料:《最优化基础理论与方法》复旦大学出版社一维搜索在xk+1=xk+ak∗dk,k=0,1,2,...\mathbf{x}^{k+1}=\mathbf{x}^k+a_k*\mathbf{d}^k, k=0,1,2,...中,假定在xk\mathbf{x}^k处的搜索方向dk\mathbf{d}^k已经确定,怎样寻找沿dk\mathbf{d}^k方向合适的步长aka_k,以确定xk+1=xk+a原创 2016-11-06 16:49:16 · 1740 阅读 · 0 评论 -
数据挖掘和机器学习的策略
实习体验我的第一份真正意义上的实习是在一家游戏公司做数据挖掘。到公司的第一天,才发现会写各种sql查询语句多么重要。因为一切数据挖掘的起点,都是从数据库中提取需要的特征,自然熟悉表和sql语言则是必备的技能之一。第一份项目是预测用户是否最终成为大户(即累计付费金额达到某一阈值),老大让我用决策树。当时还没有真正做过决策树,就看着spark的API文档做。因为spark的机器学习库mllib已经把大部原创 2016-12-06 17:03:14 · 828 阅读 · 0 评论