机器学习
姬小野
这个作者很懒,什么都没留下…
展开
-
Python实现简单分类器
文章目录@[toc]第一步,导入我们需要的python库第二步,获取训练数据并解析坐标第三步,随机化数据第四步、生成分界线斜率第五步、处理测试数据第六步、输出展示分类结果输入数据完整代码今天重新开始学习机器学习,训练了一个简单的分类器。如何工作的呢?给定一组训练数据,他们的参数有三个,x轴坐标,y轴坐标,类别。即(x, y, c)。如图所示红色的圆点代表第一类点,类别编号为1;蓝色的倒三角...原创 2018-09-21 23:57:01 · 17349 阅读 · 1 评论 -
opencv-python 人脸识别尝试——knn与深度学习
文章目录引言人脸数据获取处理图片读取到并数组中调用opencv内置函数进行人脸识别knn算法进行人脸识别使用Dense层神经网络进行人脸识别引言人脸识别和人脸检测不同,人脸检测时检测到人脸位置,而人脸识别是基于人脸数据库,进行一些识别操作如识别某一个人像是数据库中的哪个标签。需要说明的是,使用knn和Dense层的神经网络作为人脸识别算法只是我的尝试,在实际的使用中基本不使用这两种算法的。同...原创 2019-06-09 23:30:18 · 2393 阅读 · 0 评论 -
python openCV调用摄像头进行人脸识别
整个过程很简单,因为不是自己训练人脸特征模型,而是使用的官方的Haar分类器(但是这样的话实测识别不是很准确)。过程可以概括为:1、调用电脑摄像头,并不断读取frame2、对每一个读取到的frame,进行灰度处理3、调用官方给出的人脸分类器文件haarcascade_frontalface_default.xml。安装了openCV库以后可以使用everything工具搜索这个文件所在位置...原创 2019-05-31 10:54:50 · 9138 阅读 · 1 评论 -
逻辑斯蒂回归 - 多项式回归
文章目录一、预期结果二、实验步骤1)生成数据2)算法实现问题1:为什么要用到sigmoid函数问题2:如何计算梯度算法步骤:1、获取规格化数据(系数矩阵、标签)2、梯度上升法拟合系数3、画图,看看拟合的准不准结果完整代码实现:一、预期结果训练一个基于逻辑斯蒂回归的机器学习模型,它能够训练出一条二次曲线,实现二分类问题。他不是线性的,而是多项式的。二、实验步骤1)生成数据首先,我们预期得到...原创 2019-05-15 13:34:56 · 1714 阅读 · 0 评论 -
给代码分类-朴素贝叶斯
今天闲来无事,就用朴素贝叶斯算法写了一代码分类的程序,用来分辨是C++代码还是Python代码。传统方法其实用传统的特征字符串方法可以很轻松地做到(在常规环境下),毕竟python很少会有#include、iostream、namespace、cout、cin等词,而C++很少会有import、from、def、list、numpy等词,所以在普通的环境下是很容易识别成功的。def cla...原创 2019-05-14 23:57:09 · 514 阅读 · 0 评论 -
根据位置(从json)绘制人脸框图
今天做了一个人脸检测的网站,调用了face++的API。效果还不错。github地址:https://github.com/JameyWoo/face_detect网站地址:face.fiveplus.top(网址可能会变更,今天是2019/5/3)网站界面API返回的是一个json字符串,其中有一项属性是人脸的位置解析json文件的时候会出现一个问题是:它返回的引号是单引号...原创 2019-05-03 23:40:04 · 1668 阅读 · 0 评论 -
php上传文件项目及环境搭建
这是一个用python+html+php+css做的非常简单地小项目,可以上传一张规格化图片,然后识别出这个数字是什么。由于我用的是非常裸的KNN算法,训练数据集也不是很大,所以对图片的要求非常高。图片是32*32像素的,要求和训练集非常相似的写法才能有较高的识别正确率。项目地址:https://github.com/JameyWoo/digits-web网址:jamey.fiveplus....原创 2019-05-03 18:02:36 · 419 阅读 · 0 评论 -
《机器学习实战》笔记1 - KNN手写数字
文章目录涉及到的python知识点1、np.tile()广播2、os.listdir() 获取目录文件3、open(filename, 'r') 打开文件4、argsort()5、python字典添加元素的方法6、python字典按value排序7、混淆矩阵8、recall、precision、F-Measure完整KNN示例代码涉及到的python知识点1、np.tile()广播功能:在K...原创 2019-05-02 09:43:24 · 963 阅读 · 0 评论 -
使用NLP库textblob进行情感分析-红楼梦评论
最近做了一个分析国外读者对红楼梦评价的小项目。这部分是使用textblob库对评论进行情感分析,得到情感值,并且进行分类,生成词云。生成直方图、条形图的数据分析过程见我的这篇文章读入的数据是这样的格式。包含两行,一行评论,一行url来源。生成的结果是这样的result.csv文件词云图片:代码如下from textblob import TextBlobfrom wordclo...原创 2019-04-11 23:53:47 · 3759 阅读 · 10 评论 -
在colab上使用自己的数据集
1、colab 可以非常方便地将ipynb保存到github上!有趣。2、colab 从github上加载数据集,666,简直不能更方便啊。使用!git clone https://github.com/JameyWoo/myDataSet.git即可将github上的文件克隆到colab的当前目录下,然后就可以愉快地使用自己的数据集了。!ls -R 查看当前目录下的文件及所有的子目录文...原创 2019-03-31 10:34:39 · 21895 阅读 · 0 评论 -
hands-on-ml chapter2 笔记
批量学习(batch learning),一次性批量输入给学习算法,可以被形象的称为填鸭式学习。在线学习(online learning),按照顺序,循序的学习,不断的去修正模型,进行优化。batch learning 如果数据很大的话,可以使用MapReduce技术,或者使用online learning。performance measure 使用RMSE(root mean squar...原创 2019-03-30 23:08:22 · 281 阅读 · 0 评论 -
导入tensorflow 因numpy报错:ModuleNotFoundError: No module named 'numpy.core._multiarray_umath'
今天装了好久tensorflow,终于安装好了导入的时候却出现报错。报的几个错都跟numpy有关,其中有一个是这样的:ModuleNotFoundError: No module named ‘numpy.core._multiarray_umath’解决方法是:卸载numpy,然后重新安装。...原创 2019-03-07 22:21:12 · 16639 阅读 · 5 评论 -
PIL图像处理-二值化
时隔很久才知道原来这种对图像的处理方式叫做二值化!什么是二值化呢?就是把一张图的像素点编程0或255,完全的白或黑。比如这么一张32*32的小图片(当然他已经是黑白的了)二值化处理之后,每个像素点上就只有两个值,要么是True要么是False。将其转化为0,1之后,就变成下面这样这样处理数据会很方便。需要导入的库是PIL源码from PIL import Imageimpor...原创 2019-02-25 23:39:33 · 11418 阅读 · 0 评论 -
给散点图加legend图例
首先从文件导入数据,并进行格式化为numpy矩阵import numpy as npdef file2array(filename): file = open(filename) file_lines = file.readlines() numberOfLines = len(file_lines) dataArray = np.zeros((numberO...原创 2019-02-25 18:07:02 · 14575 阅读 · 2 评论 -
K近邻算法-KNN-python简单实现
KNN算法是一种简单的机器学习算法,从大致原理上来理解相对简单。主要思路就是计算要分类的测试特征向量与训练数据集的特征向量的距离,计算距离的方法可以有很多种(如欧氏距离,海明距离),选取与其距离最小的k个特征向量,然后分析这k个向量所属的类别,其中,数量最多的类别可是做测试数据的类别。因此KNN可用于简单分类。K值得选择会对K近邻算法的结果产生重大影响。k近邻法没有显式的学习过程。没有训练算...原创 2019-02-24 21:38:33 · 423 阅读 · 0 评论 -
无监督式学习-鸢尾花数据降维and聚类
一. 使用PCA(主成分分析)进行降维实现数据可视化降维的任务是要找到一个可以保留数据本质特征的低维矩阵来表示高维数据, 通常用于辅助数据可视化的工作.下面我们使用主成分分析(principal component analysis, PCA)方法, 这是一种快速线性降维技术. 模型返回两个主成分, 用二维数据表示鸢尾花的4维数据.1. 首先导入数据import seaborn as sn...原创 2018-11-17 17:29:28 · 2054 阅读 · 0 评论 -
高斯朴素贝叶斯方法进行鸢尾花分类
贝叶斯方法完整代码import seaborn as snsiris = sns.load_dataset('iris')X_iris = iris.drop('species', axis=1)y_iris = iris['species']print(X_iris)from sklearn.cross_validation import train_test_splitXtr...原创 2018-11-17 16:36:56 · 9423 阅读 · 0 评论 -
Scikit-Learn的评估器API学习-线性分类器
Scikit-Learn的评估器API遵照以下设计原则:统一性内省限制对象层级函数组合明智的默认值使用Scikit-Learn评估器API训练模型的常用步骤:一. 通过从Scikit-Learn中导入适当的模型评估器, 选择模型类如从线性模型中选择线性回归模型from sklearn.linear_model import LinearRegressionps. sk...原创 2018-11-17 12:24:10 · 351 阅读 · 0 评论 -
darknet--目标检测开源库学习记录
官网链接darknet 实现了c语言版本的yolo v3, 不依赖任何其他库. 因此安装非常简单.效果图:如何安装?git clone https://github.com/pjreddie/darknetcd darknetmake然后下载yolov3权重, 放到darknet根目录下wget https://pjreddie.com/media/files/yolov...原创 2019-06-28 21:45:10 · 1329 阅读 · 0 评论