机器学习
VM_Alike
这个作者很懒,什么都没留下…
展开
-
Python画ROC+AUC
最近在写论文,最后的实验部分是需要用ROC和AUC比较不同模型的分类效果。代码如下:# -*- coding: utf-8 -*-import matplotlib.pyplot as pltfrom sklearn import svmfrom sklearn.metrics import roc_curve, auc ###计算roc和aucimport numpy as npimport random#模型一res_1 = np.load('./hyh_auc_roc_res.n原创 2020-09-04 17:28:37 · 2201 阅读 · 0 评论 -
恶意JavaScript代码检测文献阅读(一)
《A machine learning approach to detection of JavaScript-based attacks using AST features and paragraph vectors》《一种基于javascript的攻击,使用AST特征和段落向量的机器学习检测方法》作者:Samuel Ndichu ,Sangwook Kim ,Seiichi Ozaw...原创 2020-04-09 23:38:16 · 1271 阅读 · 0 评论 -
PaddlePaddle离线安装教程(不使用docker),Linux和Windows
笔者这周在部署项目的时候面临PaddlePaddle批量部署的问题,这就不仅要求是离线安装,还要求安装包不能过大。当时在网上没有找到想要的教程,就去GitHub上提问PaddlePaddle的工程师了。GitHub问题链接,但是使用docker的话镜像文件解压后有12个G(pip在线安装安装包大小是200+M),这对于项目的批量部署来说是不能接受的。而且docker安装的镜像环境中集成了太多的工具...原创 2019-12-20 19:12:27 · 6261 阅读 · 7 评论 -
NLP:用Senta做文本情感分析
笔者在做Web敏感信息检测功能时,需要用到NLP领域的文本情感分析,这里用的是百度的预训练模型Senta。一、下载预训练模型百度提供的预训练模型在GitHub上Senta,该模型所需环境是PaddlePaddle,这里就不得不吐槽一下在线安装的速度简直不要太慢。二、修改代码笔者的需求是我将一个网页中含有敏感信息的语句存入一个文件中,然后利用Senta对文件中的所有数据进行预测,...原创 2019-12-16 15:16:22 · 3527 阅读 · 0 评论 -
机器学习:监督学习各方法特点及适用情况
今天是属于程序员的节日,所以笔者便写篇博客记录最近所学。笔者最近在学习传统的机器学习方法,目前在看的主要是监督学习,总结如下:一、感知机感知机是二类分类的线性分类模型(即适用于二类分类),其输入为实例的特征向量,输出为实例的类别,取值为+1和-1二值。感知机的模型特点是分离超平面,属于判别模型。学习策略是极小化误分点到超平面的距离,利用梯度下降法对损失函数进行极小化。该算法具有简单而易于实...原创 2019-10-24 10:24:14 · 5312 阅读 · 0 评论