机器学习
文章平均质量分 96
Asia-Lee
计算机视觉,自然语言处理,深度学习等
展开
-
机器学习入门总结
目录机器学习入门概述总结前言:1、机器学习的定义2、机器学习的领域3、机器学习算法类型(1)监督学习(Supervised Learning)(2)无监督学习(Unsupervised Learning)(4)半监督学习(Semi-supervised Learning)(5)强化学习(Reinforcement Learning)(6)遗传算法(Genet...原创 2018-04-14 22:26:36 · 1475 阅读 · 0 评论 -
机器学习分类算法常用评价指标
目录1. 准确率,召回率,精确率,F1-score,Fβ,ROC曲线,AUC值2. 宏平均(Macro-averaging)和微平均(Micro-averaging)3. Python3 sklearn实现分类评价指标1. 准确率,召回率,精确率,F1-score,Fβ,ROC曲线,AUC值 为了评价模型以及在不同研究者之间进行性能比较,需要统一的评价标准。...原创 2018-10-16 17:42:31 · 15594 阅读 · 1 评论 -
朴素贝叶斯算法实现新闻分类(Sklearn实现)
目录1、朴素贝叶斯实现新闻分类的步骤2、代码实现1、朴素贝叶斯实现新闻分类的步骤(1)提供文本文件,即数据集下载(2)准备数据 将数据集划分为训练集和测试集;使用jieba模块进行分词,词频统计,停用词过滤,文本特征提取,将文本数据向量化 停用词文本stopwords_cn.txt下载 jieba模块学习:https:...原创 2018-08-01 13:06:25 · 11567 阅读 · 3 评论 -
逻辑回归算法处理简单数据
代码实现(1)数据处理; (2)sigmoid函数; (3)梯度上升算法; (4)改进的随机梯度上升算法; (5)绘图# -*- coding:UTF-8 -*-import matplotlib.pyplot as pltimport numpy as npimport random"""函数说明:加载数据Parameters: 无Returns: ...原创 2018-08-05 12:07:50 · 4195 阅读 · 0 评论 -
SVM算法实现手写数字识别(Sklearn实现)
1、Sklearn.svm学习 数据集下载:trainingDigits训练集下载,testDigits测试集下载 详细数据介绍参看:KNN算法实现手写数字识别2、代码实现# -*- coding: UTF-8 -*-import numpy as npfrom os import listdirfrom sklearn.svm import SV...原创 2018-08-04 17:09:35 · 20780 阅读 · 7 评论 -
朴素贝叶斯算法实现垃圾邮件过滤(Python3实现)
目录1、朴素贝叶斯实现垃圾邮件分类的步骤2、数据集下载3、代码实现4、朴素贝叶斯的优点和缺点1、朴素贝叶斯实现垃圾邮件分类的步骤(1)收集数据:提供文本文件。(2)准备数据:将文本文件解析成词条向量。(3)分析数据:检查词条确保解析的正确性。(4)训练算法:计算不同的独立特征的条件概率。(5)测试算法:计算错误率。(6)使用算法:构建一个完整的程序对一组...原创 2018-07-30 17:50:12 · 40986 阅读 · 38 评论 -
KNN算法实现手写数字识别(Sklearn实现)
目录KNN项目实战——手写数字识别1、数据集介绍2、准备数据:将图像转换为测试向量3、代码实现KNN项目实战——手写数字识别1、数据集介绍需要识别的数字已经使用图形处理软件,处理成具有相同的色彩和大小:宽高是32像素x32像素的黑白图像。尽管采用本文格式存储图像不能有效地利用内存空间,但是为了方便理解,我们将图片转换为文本格式。数字的文本格式如下:...原创 2018-07-15 11:28:32 · 24724 阅读 · 5 评论 -
KNN算法改进约会网站的配对效果(Python3实现)
目录KNN项目实战——改进约会网站的配对效果1、项目背景:2、项目数据3、K-近邻算法的一般流程4、项目步骤及代码实现5、项目结果KNN项目实战——改进约会网站的配对效果1、项目背景:海伦女士一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人。经过一番总结,她发现自己交往过的人可以进行如下分类:不喜欢的人...原创 2018-07-13 20:36:12 · 5876 阅读 · 0 评论 -
决策树算法ID3算法(Python3实现)
目录1、数据集准备2、使用ID3算法递归构建决策树并使用决策树执行分类2.1 ID3算法概述2.2 递归终止的条件:2.3 代码实现如下:3、Matplotlib实现决策树可视化4、决策树的存储与读取5、决策树优点和缺点1、数据集准备 ...原创 2018-07-19 16:57:30 · 43493 阅读 · 11 评论 -
决策树算法熵与信息增益(Python3实现)
目录1、熵、条件熵与信息增益(1)熵(entropy)(2)条件熵(conditional entropy)(3)信息增益(information gain)2、信息增益算法实现流程3、数据集以及每个特征信息增益的计算4、Python3实现熵与信息增益选择最优特征补充:信息增益比(增益率)1、熵、条件熵与信息增益(1)熵(entropy)(...原创 2018-07-17 17:30:49 · 15481 阅读 · 5 评论 -
K-近邻法(KNN算法)
目录1、kNN算法(K 最近邻(k-Nearest Neighbors))描述2、KNN算法的工作原理:3、KNN算法的一般流程4、KNN算法的优点和缺点5、应用KNN的常见问题6、KNN与推荐系统7、KNN算法的应用领域8、KNN算法实战:电影分类1、kNN算法(K 最近邻(k-Nearest Neighbors))描述简单地说,k-近邻算法采用测量不同特...原创 2018-04-19 19:28:29 · 16060 阅读 · 0 评论 -
机器学习中的特征工程
目录一、特征工程——概述二、特征工程——数据预处理三、特征工程——特征选择四、特征工程——降维一、特征工程——概述特征工程是数据分析中最耗时间和精力的一部分工作。数据和特征决定了机器学习的上限,而模型和算法则是逼近这个上限。因此,特征工程就变得尤为重要了。特征工程的主要工作就是对特征的处理,包括数据的采集,数据预处理,特征选择,甚至降维技术等跟特征有关的工作。1、特征(...原创 2018-12-06 20:26:04 · 18980 阅读 · 10 评论