机器学习实战
脸红的思春期
努力
展开
-
目录遍历好帮手-Python中os.walk用法介绍
python中os.walk是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情。os.walk() 顾名思义是在os模块中的方法,在需要查找操作文件时,经常得对文件和路径进行操作,这些操作都得依赖os模块协助。os.walk()可以得到一个三元tupple(parent, dirnames, filenames)。parent:起始路径。dirnames:起始路...原创 2018-11-20 17:23:47 · 1446 阅读 · 0 评论 -
【基础算法】K-近邻演算法(kNN)(k-NearestNeighbor)概述及Python实践
K-近邻演算法原理:测量不同特征值之间的距离方法来分类优点:精度高、对异常值不敏感、对输入数据无假定缺点:计算复杂度高、空间复杂度也高适用数据:数值型和标称型工作原理取一个样本数据集作为训练样本集,并且训练集中的每个数据都有标签,则我们知道了训练集中每一条数据与所属分类的对应关系后,每当输入没有标签的新数据后,将新数据与训练集中的每一条数据进行比较,然后算法返回最相似数据(最近邻)的...原创 2019-04-15 16:10:45 · 268 阅读 · 0 评论 -
Python Numpy 函数库基础
Python的优缺点虽然Java或C等强类型语言也有矩阵数据库,但即使是简单的操作也需要编写大量的代码才能完成,相比之下Python较为简单、清晰而且易于了解,但Python身为高级编程语言的缺点是性能问题,其程序的运行效率不如Java或者C高,但我们仍能够透过Python调用C编译的代码,同时利用两者的优点。Numpy函数库机器学校算法涉及到很多线性代数的知识,故此时可以调用Numpy函...原创 2019-04-14 17:51:12 · 406 阅读 · 0 评论 -
【基础算法】朴素贝叶斯演算法(Naive Bayes)概述及Python实践
贝叶斯演算法原理:透过概率论中的条件概率进行分类。会称谓’朴素’是因为整个形式化的过程只做最原始、最简单的假设。目标:分类未知类别的案例,用以理解数据中所蕴涵的知识讯息优点:在数据教少时仍然有效,可以处理多类别问题缺点:对输入数据的准备方式较为敏感适用数据:标称型输入:未知类别的实例输出:输入实例的类别工作原理朴素贝叶斯算法是基于贝叶斯定理与特征条件独立假设的分类方法。贝叶斯...原创 2019-04-16 19:32:11 · 336 阅读 · 0 评论 -
【基础算法】决策树演算法(Decision Tree)概述及Python实践
决策树演算法原理:透过特征值构成树结构来分类,找出在划分数据集时找出哪个特征起到了决定性的作用。目标:分类未知类别的案例,用以理解数据中所蕴涵的知识讯息优点:计算复杂度不高,输出结果易于了解,对中间值的缺失不敏感、可以处理不相关的特征数据缺点:可能有过度匹配的问题适用数据:数值型和标称型输入:未知类别的实例输出:输入实例的类别工作原理从数据集中提取出一系列规则,在每次划分前找出...原创 2019-04-16 14:35:30 · 639 阅读 · 0 评论 -
三步骤安装WSL(Bash on Ubuntu on Windows)
在Windows系统中建立Unix虚拟机1.打开开发者模式访问设置 -> 更新和安全 -> 针对开发人员, 然后打开 开发人员模式2.安装WSL在开始菜单里, 搜索 “启用或关闭Windows功能”, 打开对应的控制面板, 勾选名为 “适用于Linux的Windows子系统(Beta)” 的多选框。点击确定, 并按照指令操作,会多次重启你的电脑。3.创建一个Unix...原创 2019-02-26 16:54:51 · 2191 阅读 · 0 评论 -
Python下使用SIFT算法描绘两张图片的相似特征点
1.背景项目需要,透过可视化的图片连接两张图的相似点检查SIFT之正确率2.效果3.代码def drawMatchLine(Img1Path , Img2Path ): # 读入图片 Img1 = cv2.imread(Img1Path) Img2 = cv2.imread(Img2Path) # 创建识别器 detector =...原创 2019-01-15 18:35:40 · 4726 阅读 · 3 评论 -
python环境下OpenCV提取SIFT特征并保存
1.背景项目需要SURF算法作为相似度判别时因SIFT中detecetAndCompute阶段时间过长故先将特征点保存后再使用时直接调用即可2.代码# -*- coding: utf-8 -*-"""Created on Mon Jan 14 14:56:27 2019@author: jwjiang"""import cv2import numpy as npinp...原创 2019-01-14 16:57:36 · 5941 阅读 · 4 评论 -
Python环境下SURF算法特征点计算并保存
1.背景项目需要SURF算法作为相似度判别时因SURF中detecetAndCompute阶段时间过长故先将特征点保存后再使用时直接调用即可2.代码# -*- coding: utf-8 -*-"""Created on Mon Jan 14 14:56:27 2019@author: jwjiang"""import cv2import numpy as npinp...原创 2019-01-14 16:50:05 · 2309 阅读 · 3 评论 -
SIFT&OpenCV算法之特征点可视化
尺度不变特征变换 (Scale-invariant feature transform , SIFT)SIFT特征是基于物体上的一些局部外观的兴趣点而与影像的大小和旋转无关。对于光线、噪声、微视角改变的容忍度也相当高.基于这些特性,它们是高度显著而且相对容易撷取,在母数庞大的特征数据库中,很容易辨识物体而且鲜有误认.使用SIFT特征描述对于部分物体遮蔽的侦测率也相当高,甚至只需要3个以上的SIF...原创 2019-01-02 12:22:15 · 2515 阅读 · 0 评论 -
Google图片爬虫代码
# -*- coding: utf-8 -*-"""Created on Mon Nov 26 11:52:34 2018@author: jwjiang"""from selenium import webdriver import time import urllib from bs4 import BeautifulSoup as bsimport re imp...原创 2018-11-26 14:25:26 · 3384 阅读 · 0 评论 -
(三)吴恩达-机器学习第三课学习心得-矩阵和向量
1. 矩阵和向量:矩阵:由数字组成的矩形阵列矩阵的维度应该写作矩阵的行数(row)*列数(column)向量(vector):一种特殊的矩阵,向量只有一列(n*1矩阵,1 column)2.矩阵加法及减法运算加法:维度不同不能相加3.两个矩阵的相乘(Matrix-vector multiplication)4.矩阵对矩阵的乘法(Matrix-matrix multipli...原创 2018-11-23 12:10:21 · 292 阅读 · 0 评论 -
(二)吴恩达-机器学习第二课学习心得-线性回归算法(Linear regression)
1.线性回归算法(Linear regression)在监督学习中我们有一个数据集,这个数据集被称为训练集(Training set)m:训练样本的数目(有几组训练样本)x’s:输入变量,特征量,用x表示输入的特征y’s:输出变量或目标变量(预测结果)(x,y):表示一个训练样本(xi,yi):表第i个训练样本h:表hypothesis(假设),表示一个函数2.代价函数(Co...原创 2018-11-23 10:57:53 · 1586 阅读 · 0 评论 -
(一)吴恩达-机器学习第一课学习心得
L1-雇主们无法拒绝的12项IT能力-机器学习在首位1.Database mining :用算法理解数据的意义2.Application cant program by had3.Self-customizing programs监督学习:我们将教计算机如何去完成任务无监督学习:我们打算让他自己进行学习监督学习:给出一个算法,需要部分数据集已经有正确答案。监督学习又叫回归问题,意指要...原创 2018-11-23 10:50:39 · 424 阅读 · 0 评论 -
pip install 与 sudo install
pip install和sudo pip install是不一样的,如图所示,pip install调用的是anaconda安装的pip,位于/root/anaconda2/lib/python2.7/dist-packages下,安装的依赖也在这个位置,而sudo pip install调用的是系统安装的pip,位于/usr/local/lib/python2.7/dist-packages下。...原创 2018-11-16 14:08:47 · 8102 阅读 · 0 评论 -
Python中extend()与append()的差别
Python中自带的extend()与append()方法的功能类似但在处理多个列表时,这两种方法的处理结果是完全不同的>>>a=[1 , 2 , 3]>>>b=[4 , 5 , 6]>>>a.append(b)>>>a[1 , 2 , 3 , [4 , 5 , 6]]>>>a.ext原创 2018-11-20 18:23:05 · 153 阅读 · 0 评论 -
【基础算法】逻辑回归演算法(Logistic Regression)概述及Python实践
逻辑回归原理:根据现有的数据对分类边界线建立回归公式,以此进行分类目标:分类未知类别的案例,用以理解数据中所蕴涵的知识讯息优点:计算代价不高,易于实现与理解缺点:容易欠拟合,分类精度可能不高适用数据:数值型和标称型数据输入:未知类别的实例输出:输入实例的类别工作原理逻辑回归是以线性回归为理论支持的,但是逻辑回归通过Sigmoid函数引入了非线性因素,因此可以轻松处理0/1分类问...原创 2019-04-18 11:17:56 · 507 阅读 · 0 评论