![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 85
qq_32659887
这个作者很懒,什么都没留下…
展开
-
浅谈数据挖掘与机器学习
引言 在大多数非计算机专业人士以及部分计算机专业背景人士眼中,机器学习(Data Mining)以及数据挖掘(Machine Learning)是两个高深的领域。在笔者看来,这是一种过高”瞻仰“的习惯性错误理解(在这里我加了好多定语)。事实上,这两个领域与计算机其他领域一样都是在融汇理论和实践的过程中不断熟练和深入,不同之处仅在于渗透了更多的数学知识(主要是统计学),在后面的文章中我会努力将转载 2017-05-23 08:47:20 · 584 阅读 · 0 评论 -
在线最优化算法梳理
文章参考自:在线最优化求解-冯杨目的从已有数据中提炼出最适合的模型参数,从而对位置的数据进行预测。当数据是高维高数据量的时候,常见的批处理方式已经显的力不从心。 个人理解:因为当数据批输入的时候,高数据量使得计算速度很慢,特征的高维度使得调参不具有针对性和重复性。 高维高数据量训练比较注重稀疏性。 部分w为零,有特征选择和降低复杂度的作用。 预备知识 凸函数的定义、严格凸函数的定义 一个函数是原创 2017-09-19 11:33:20 · 2244 阅读 · 0 评论 -
做推荐系统 细节记录
1.groupby 之后的对象转换为Dataframe object.reset_index() 2.替换指定数值 df.A = df.A.map({'F': '000', 'S': '001'}) 3.DataFrame.to_dict(orient='') dict (default) : dict like {column -> {index原创 2017-08-03 16:53:09 · 430 阅读 · 0 评论 -
数据挖掘参考资源
理论部分: 特征工程怎么做 通过一个kaggle实例学习解决机器学习问题 实践部分: 使用sklearn做特征工程 使用sklearn优雅的进行数据挖掘转载 2017-08-14 12:14:30 · 341 阅读 · 0 评论 -
How can we identify the weights of different models for ensemble?
One of the most common challenge with ensemble modeling is to find optimal weights to ensemble base models. In general, we assume equal weight for all models and takes the average of predictions. But,转载 2017-08-12 19:07:32 · 262 阅读 · 0 评论 -
七种重要的模型验证错误矩阵
预测模型的类型: 1.分类模型:分类问题中有两类算法 (1)类别输出:比如SVM,KNN等 (2)概率输出:LR,random forest,Gradient boosting,adaboost等都给出概率输出。将概率输出转换为类输出仅仅只需要设定概率阈值 2.回归模型:输出连续值 验证矩阵:翻译 2017-08-11 09:08:17 · 573 阅读 · 0 评论 -
pandas 常用方法
1.布尔筛选 data.loc[(data['a'] ==a1)&(data ['B'] ==b1),['A','B']] 2.data.apply ( func, axis=0) #axis=0 defines that function is to be applied on each column3.#对于类别变量 填补缺失值from scipy.stats import mode mo翻译 2017-08-10 21:03:16 · 462 阅读 · 0 评论 -
python用于数据科学教程
此博文是对原文的一个理解和知识点整理(个人理解可能有误),只是方便以后快速查阅。不是对原文的完全翻译,原文详细链接点击打开链接 一:python数据分析基础 二:python库和数据结构 三:pandas用于数据探索 (1)导入库 (2)读入数据:pd.read_csv() (3)查看: df.head() 大致查看数据前几行,了解内容 df.describe() 计数,平均值翻译 2017-08-10 11:52:36 · 292 阅读 · 0 评论 -
【总结】Python 2.x中常见字符编码和解码方面的错误及其解决办法
转载自:在路上 » 【总结】Python 2.x中常见字符编码和解码方面的错误及其解决办法 点击打开链接 Python 2.x中的字符编码,设计的的确不好,导致初学者,甚至是即使用Python很长时间的人,都会经常遇到字符编解码方面的错误。 下面就把一些常见情,尽量的都整理出来,并给出相应的解决办法。 看此文之前 Python中字符编码所涉及的背后逻辑(从你输入字符,到转载 2017-08-03 17:32:33 · 405 阅读 · 0 评论 -
关于netlfix的学习资料收集
源码分享: /Netflix-Prize Introduction to Restricted Boltzmann Machines Netflix prize原创 2017-09-12 09:47:14 · 347 阅读 · 0 评论