机器学习
文章平均质量分 66
woswod
这个作者很懒,什么都没留下…
展开
-
概念学习-候选消除算法-Python实现
本文最后修改时间:20180330 1、概念学习原型 已知 实例空间 X :使用属性描述的实例(定义域) 概念空间 C :目标概念集合(值域) 假设空间 H :假设集合 (各种映射的集合) 训练集合 D :目标概念的正例和反例 (已知的点) ⟨x1,c(x1)⟩,⟨x2,c(x2)⟩,...,⟨xm,c(xm)⟩⟨x1,c(x1)⟩,⟨x2,c(x2)⟩,...,⟨xm,c(...原创 2018-04-10 14:54:31 · 4118 阅读 · 5 评论 -
kNN处理iris数据集-使用交叉验证方法确定最优 k 值
基本流程: 1、计算测试实例到所有训练集实例的距离; 2、对所有的距离进行排序,找到k个最近的邻居; 3、对k个近邻对应的结果进行合并,再排序,返回出现次数最多的那个结果。 交叉验证: 对每一个k,使用验证集计算,记录k对应的错误次数,取错误数最小的k # -*- coding: utf-8 -*- import os import pandas as pd import ma...原创 2018-04-10 15:00:14 · 8776 阅读 · 11 评论 -
机器学习--十分钟上手sklearn:特征提取,常用模型,交叉验证
本文转自十分钟上手sklearn:特征提取,常用模型,交叉验证 写得简洁易懂,机器学习的几个常用算法都做了说明,值得收藏。 这一篇虽然叫做:十分钟上手sklearn:特征提取,常用模型,但是写着写着我就想把每一个模型都详细说一下,所以也可以看作是机器学习算法概述了。 上一篇我们讲解了如何安装sklearn,导入自带数据集,创建数据,对数据进行预处理,通过上一篇的讲解,相信大家能够感受到sk...转载 2018-05-01 21:49:41 · 4308 阅读 · 2 评论 -
利用机器学习进行恶意代码分类-冠军队方法分析
本文转自https://bindog.github.io/blog/2015/08/20/microsoft-malware-classification/ 原作者:宾狗 1. 前言 最近在Kaggle上微软发起了一个恶意代码分类的比赛,并提供了超过500G的数据(解压后)。有意思的是,取得第一名的队伍三个人都不是搞安全出身的,所采用的方法与我们常见的方法存在很大不同,展现了机器学习在安全领域的巨...转载 2018-11-21 10:08:10 · 1557 阅读 · 3 评论 -
逻辑回归(梯度上升、交叉验证)Python实现
目录1. 算法实现2. 代码3. 实验结果 1. 算法实现 分别采用标准化、Log、Binary 3种预处理,进行下面操作 1、数据预处理; 2、梯度上升法训练参数权重,采用十折交叉验证,选择规格化强度参数; 3、对错误数据分类,计算错误率。 程序中主要实现了如下函数: 函数 说明 def LoadData(file_path): 加载mat文件 def StndTrainDa...原创 2019-04-22 23:01:55 · 2069 阅读 · 0 评论