- 博客(5)
- 收藏
- 关注
原创 决策树算法代码实现及注释(代码来自于机器学习实战)
决策树算法理论思想:代码实现如下:from math import logimport operatordef createDataSet(): dataSet = [[1,1,'yes'],[1,1,'yes'],[1,0,'no'],[0,1,'no'],[0,1,'no']] labels = ['no surfacing','flippers'] return dataSe
2017-11-14 16:05:44 1644
原创 KNN算法Python实现(代码来自机器学习实战)及注释
kNN算法是k-近邻算法的简称,主要用来进行分类实践,主要思路如下:1.存在一个训练数据集,每个数据都有对应的标签,也就是说,我们知道样本集中每一数据和他对应的类别。2.当输入一个新数据进行类别或标签判定时,将新数据的每个特征值与训练数据集中的每个数据进行比较,计算其到训练数据集中每个点的距离(下列代码实现使用的是欧式距离)。3.然后提取k个与新数据最接近的训练数据点所对应的标签或类别
2017-11-06 15:58:23 1156
原创 mysql如何设置数据库编码为utf-8
在使用mysql过程中,发现由于要用到中文,但是输入进去数据库中的中文无法通过web页面显示出来。排查定位到是编码问题。故修改数据库编码为utf-8。1.使用root账号,打开mysql 的配置文件/etc/mysql/my.cnf.添加如下代码:(一定要注意下划线和横杠的区别)[client]port = 3306socket = /v
2016-12-27 10:52:07 8391
原创 PIL 安装与配置
PIL 安装与配置1.系统环境操作系统Ubuntu 14.04 python版本:2.7.12 2.要使用python的PIL库处理图片,需要安装Pillow(我使用的是pip install Pillow ,直接完成后发现Pillow是3.4.2版本) 这个一般可以处理png,gif格式的图片。如果要处理JPG格式的,必须保证系统有libjpeg库(且安装完一个libjpeg8.0版本之
2016-12-16 15:18:57 806
原创 Spark升级2.0.1版本安装部署教程
Spark升级2.0.1版本安装部署教程 0.集群当前环境Hadoop版本:2.7.1JDK版本:jdk1.7.0_79Hbase版本:1.1.2Spark版本:1.5.0Scala版本:2.10.41.Spark安装a) 在官网(http://spark.apache.org/downloads.html)上下载与当前hadoop版本适
2016-10-17 15:22:40 3095 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人