py数据处理及可视化
python主要数据处理库
可以调素琴
NLP[KG-dialogue]
展开
-
EDA----scipy进行正态分布检验
https://m.baidu.com/ala/c/www.360doc.cn/mip/772967525.html转载 2019-07-05 18:17:04 · 851 阅读 · 0 评论 -
利用pandas将非数值数据转换成数值
handle non numerical data举个例子,将性别属性男女转换成0-1,精通ML的小老弟们可以略过本文~~,这里不考虑稀疏向量的使用,仅提供一些思路。本来想直接利用pandas的DataFrame.iloc加上for循环直接转换,但试过一遍之后,原数据并有改变。。。。蛋疼写了一个比较 菜的函数,如下。# 非数值列处理函数def handel_non_numerical_d...原创 2019-05-24 14:01:38 · 7794 阅读 · 3 评论 -
matplotlib :lengend图例参数(bbox_to_anchor)的使用
参考博客:https://blog.csdn.net/helunqu2017/article/details/78641290缘起:仿写决策树代码时 遇到plt.legend(bbox_to_anchor=(1,0.2))此参数用来确定图例在轴的位置区别如下两图完全出于强迫症 ,一般情况这个参数其实可以不用设置,但如果出现图例遮盖了图像便需要调整…...原创 2019-05-09 21:13:53 · 8863 阅读 · 0 评论 -
python决策树可视化
转载:https://blog.csdn.net/linhai1028/article/details/79827331以后自己看 方便转载 2019-05-10 09:28:37 · 839 阅读 · 0 评论 -
matplotlib-决策界面可视化
引子:tensorflow游乐场图决策界面图直观的展示了模型分类效果,如下1,原始样本分布图2,模型决策界面可视化结果a-线性模型b-3层神经网络可见模型效果非常直观实现流程1,首先应该得到图中每个点(夸张的说法,但必须覆盖样本点,且点数 >> 样本点数)2,根据所得模型,计算所有点的分类情况思路很简单,主要是matplotlib,numpy相应函数的组合...原创 2019-07-01 16:49:59 · 679 阅读 · 2 评论 -
二分类评估器-----ROC以及AUC【含python实现】
2019.06.30晚下周四面试nlp,顺便复习一下机器学习A引:以正负标签为例,在正负样本均衡情况下,单纯的使用准确率即可。但如果样本正负分布极端不平衡,这将导致准确率很高但实际模型效果很差的情况。比如预测地震,1000个地质状态里面可能只有一个将发生地震,模型直接全部预测为不发生那么准确率为100%,但效果很差。因此单纯准确率有时是不可信的!!!Bsample:{P, N} 样本集...原创 2019-07-01 01:09:33 · 1958 阅读 · 0 评论