机器学习实战
文章平均质量分 70
介绍学习机器学习实战的一些经验和感触
半吊子Py全栈工程师
失败的人只有一种,就是在成功之前放弃的人。
展开
-
使用KNN简单进行手写体识别
实际使用这个算法时,相对简单,但是算法的执行效率并不高。因为算法需要为每个测试向量做2000次距离计算,每个距离计算包括了1024个维度浮点运算,总计要执行900次,此外,我们还需要为测试向量准备2 M B的存储空间。下次介绍优化版-k决策树import numpy as npimport operatorfrom os import listdirdef img2vector(file...原创 2018-05-09 21:04:00 · 941 阅读 · 0 评论 -
Surprise——Python的推荐系统库(1)
基于Surprise推荐系统实战本文就movielens数据集做测试,实践推荐。movielens数据集格式为:user item rating timestamp 其中主要用到前三列,timestamp在处理自己的数据集的时候可以用别的特征替换,在此不做详细说明。本文基于开源推荐框架surprise,传送门。官网上的例子直接用 Dataset.load_builtin(‘ml-100k’)载入数...转载 2018-04-17 20:22:19 · 11432 阅读 · 3 评论 -
机器学习-数据归一化
定义数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。两种常用的归一化方法 min-max标准化Z-score标准化方法优点归一化后加快了梯度下降求最优解的速度;归一化有...转载 2018-04-11 16:43:49 · 1336 阅读 · 0 评论 -
KNN近邻算法预测爱的程度
基本上把一些点都注释了,使用的原始数据是在网上找的import numpy as npimport matplotlib.pyplot as pltimport matplotlibimport operatorfrom os import listdir# 设置在图像中可以使用中文from matplotlib.font_manager import FontProperties...原创 2018-04-11 22:24:37 · 3843 阅读 · 0 评论 -
机器学习中最重要的公式——贝叶斯公式
概率论只不过是把常识用数学公式表达了出来。——拉普拉斯记得读本科的时候,最喜欢到城里的计算机书店里面去闲逛,一逛就是好几个小时;有一次,在书店看到一本书,名叫贝叶斯方法。当时数学系的课程还没有学到概率统计。我心想,一个方法能够专门写出一本书来,肯定很牛逼。后来,我发现当初的那个朴素归纳推理成立了——这果然是个牛逼的方法。——题记目录0. 前言 1. 历史 1.1 一个例子:自然语言的二义性...转载 2018-04-12 20:32:08 · 11815 阅读 · 2 评论 -
基于贝叶斯公式的拼写检查器
import re, collections# 拼写检查器def words(text): # 只筛选出字母,将所有的字母会变成小写,变成一个个单词了 return re.findall('[a-z]+', text.lower())def train(features): # 遇到新的单词,设置词频默认为1(表示很小的概率) model = coll...原创 2018-04-13 20:03:16 · 3656 阅读 · 0 评论 -
opencv中,给图片添加汉字的问题
背景,是需要在一个图片上进行画线,等操作,需要写入汉字,但OpenCV的cv2的putText不支持中文查看资料发现2个方法: 1,将cv2图片转为pil然后在添加上汉子后,在转成cv2格式((pil下载地址)https://www.lfd.uci.edu/~gohlke/pythonlibs/#pillow) 2,freetype实现OpenCV2.x的中文输出这里我使用了第一种方法...原创 2018-04-10 21:43:12 · 5031 阅读 · 1 评论 -
机器学习之十大常用算法
最近学习一些算法,看到这篇文章发现写的很好,没有代码,但是可以让人很清晰的理解十大算法通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 以后有时间再对单个算法做深入地解析。今天的算法如下:决策树随机森林算法逻辑回归SVM朴素贝叶斯K最...转载 2018-04-04 21:33:09 · 2609 阅读 · 1 评论 -
OpenCV 下载驿站
鉴于在OpenCV官网下载速度很慢,国内访问也不稳定,本博客将提供百度云盘下载链接,持续更新OpenCV及相关书籍下载,欢迎光临!V3.3.0(2017.9.9号更新)opencv-3.3.0-vc14.exeopencv-3.3.0-ios-framework.zip(IOS)opencv-3.3.0.zip(Linux/Mac)opencv-3.3.0-android-sdk.zip(Andr...转载 2018-04-07 21:00:27 · 2876 阅读 · 0 评论 -
OpenCV读入图片,视频
import numpy as npimport cv2import timeimport sys# sys.path.insert(0,'E:\open\opencv\sources\modules\imgproc\src')print(sys.path)"""读取视频文件"""# 使用本机的摄像头是0,可以使用1或其它来使用其它摄像头# 创建摄像对象cap = cv2.VideoCapture...原创 2018-04-08 22:35:41 · 1616 阅读 · 0 评论