机器学习
可以调素琴
NLP[KG-dialogue]
展开
-
python决策树可视化
转载:https://blog.csdn.net/linhai1028/article/details/79827331以后自己看 方便转载 2019-05-10 09:28:37 · 839 阅读 · 0 评论 -
利用pandas将非数值数据转换成数值
handle non numerical data举个例子,将性别属性男女转换成0-1,精通ML的小老弟们可以略过本文~~,这里不考虑稀疏向量的使用,仅提供一些思路。本来想直接利用pandas的DataFrame.iloc加上for循环直接转换,但试过一遍之后,原数据并有改变。。。。蛋疼写了一个比较 菜的函数,如下。# 非数值列处理函数def handel_non_numerical_d...原创 2019-05-24 14:01:38 · 7792 阅读 · 3 评论 -
KMeans聚类,GMM算法,EM算法通俗详解
首先推荐两个链接1 刘建平博客园:https://www.cnblogs.com/pinard/category/894692.html【具体内容自行查看】2 ApacheCN github:https://github.com/apachecn/AiLearning/blob/master/docs/ml/10.k-means聚类.md注:本文基本没有公式推导,写这篇博客的起因是我注意到一...原创 2019-05-21 17:59:41 · 1831 阅读 · 0 评论 -
GBDT与XGBoost【基于负梯度拟合】的说明
为了不让自己在深度学习的网络里迷失…嗝~~,回顾了一下机器学习相信大家看到集成学习的时候,类似于adaboost等思路还是挺清晰的,BDT里面的基于拟合残差思想也好理解,但是碰到gbdt时候有点蒙蔽【只针对小白,大佬绕行…】----这怎么就变成了根据损失函数的负梯度拟合呢,(编辑公式有点烦,我就把pad笔记拿上来)说明:t是更新到第t次的意思,i是样本标记,为什么不写xgboost?,因为x...原创 2019-06-06 09:44:47 · 988 阅读 · 0 评论 -
matplotlib-决策界面可视化
引子:tensorflow游乐场图决策界面图直观的展示了模型分类效果,如下1,原始样本分布图2,模型决策界面可视化结果a-线性模型b-3层神经网络可见模型效果非常直观实现流程1,首先应该得到图中每个点(夸张的说法,但必须覆盖样本点,且点数 >> 样本点数)2,根据所得模型,计算所有点的分类情况思路很简单,主要是matplotlib,numpy相应函数的组合...原创 2019-07-01 16:49:59 · 679 阅读 · 2 评论 -
二分类评估器-----ROC以及AUC【含python实现】
2019.06.30晚下周四面试nlp,顺便复习一下机器学习A引:以正负标签为例,在正负样本均衡情况下,单纯的使用准确率即可。但如果样本正负分布极端不平衡,这将导致准确率很高但实际模型效果很差的情况。比如预测地震,1000个地质状态里面可能只有一个将发生地震,模型直接全部预测为不发生那么准确率为100%,但效果很差。因此单纯准确率有时是不可信的!!!Bsample:{P, N} 样本集...原创 2019-07-01 01:09:33 · 1957 阅读 · 0 评论