![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
ML 分类
weixin_40922555
这个作者很懒,什么都没留下…
展开
-
信用卡欺诈检测
用pandas,numpy,matplotlib来进行分析和建模的工作。 0 正常 1异常 做一个分类的任务 逻辑回归相当于一个分类问题。通过一个阈值,把一个得分值映射成一个概率值。通过概率值跟阈值进行一个比较。>0.5取1这个类别,<0.5取0这个类别。接下来用逻辑回归进行建模进行分类这样一个任务。 考虑实际,银行中可能99%都是正常数据信用卡,只有极少数诈骗数据。绝大多数是正...原创 2019-04-28 23:22:23 · 511 阅读 · 0 评论 -
2019.5.5Py文本数据分析
计算两个句子的相似度: 句子–分词–语料库–词频–词频向量 利用向量计算相似度 余弦相似度 接下来文本分类:时尚;军事;新闻;生活;文化类等等。 数据源来自搜狗实验室 名字命名了四个如下: head就是看一下指定的前20个或者前几个。 wordcloud库:文本可视化如下图 好玩的网址:githup/amueller/word_cloud LDA:主题模型 无监督的不知道语料是什么主...原创 2019-05-05 19:11:43 · 194 阅读 · 0 评论 -
19/6/4K近邻算法分类RAWDATA
粘贴代码片啊啊啊 就是https://blog.csdn.net/yi_tech_blog/article/details/70184931 这篇博客仿照它做的啊 我的程序命名为huafenlei.m 为什么他的识别率是0%呢? 枯了。 ...原创 2019-06-04 22:00:28 · 132 阅读 · 0 评论