工程
文章平均质量分 69
小太皮
这个作者很懒,什么都没留下…
展开
-
dataframe数据之间求补集
python的pandas库,对于dataframe数据,有merge命令可以完成dataframe数据之间的求取交集并集等命令。若存在df1与df2 ,他们的交集df3=pd.merge(df1,df2,on=[.....])。但是又想通过df3求df3与df1的补集时发现没有该命令。求df3(子集)与df1补集:#x为子集def Complement(x,y):原创 2017-12-19 16:53:58 · 4260 阅读 · 5 评论 -
运用pandas将字典的列表转化为独立的数据列
在Stack Overflow看到的一个帖子table0.csv数据集如下:namestatusnumbermessagemattactive12345[job: , money: none, wife: none]jamesactive23456[group: band, wife: yes, money: 10000]adaminactive34567[job: none, money: n...翻译 2018-03-10 18:58:06 · 4179 阅读 · 0 评论 -
混淆矩阵(confusion matrix)
混淆矩阵是一种常见的评判分类好坏的方式。所有正确的预测结果都在对角线上,所以从混淆矩阵中可以很方便直观的看出哪里有错误,因为他们呈现在对角线外面。例如下表:我们可以非常直观地看出对b类预测的非常准确,而对c类的预测却差强人意 。允许我们做出更多的分析,仅考虑对a类的分类,可以得到下表:可以得到精度(precision),召回率(recall),结合两者的F1数。pr...原创 2018-08-17 23:10:15 · 952 阅读 · 0 评论