自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 实现Logistic回归

Logistic回归介绍 logistic回归是研究观察结果为二分类或多分类时,与影响因素之间关系的一种多变量分析方法,属于概率型非线性回归。它的主要是想是根据现有数据对分类边界线建立回归公式,并以此进行分类。 通过分类边界线进行分类,具体说来就是将每个测试集上的特征向量乘以回归系数(即最佳拟合参数),再将结果求和,最后输入到logistic函数(也叫sigmoid函数),根据sigm

2017-08-03 10:40:18 535

原创 实现标准线性回归

介绍 线性回归是假设特证满足线性关系,根据给定的训练数据训练一个模型,即回归方程,并用此模型进行预测,回归:求回归系数的过程。具体做法是用回归系数乘以输入值,将结果相加,得到预测值。它是一种针对数值型数据的监督学习方法。 特点 适用于数值型,如果是标称型或名义型的数据,需要转为数值型数据 对于非线性数据拟合较差 查看数据分布 数据集包含150个样本,每个样本共2个特征,第1个为输入,第2个为结果

2017-07-27 13:00:45 542

原创 实现决策数(ID3)算法

ID3决策树算法介绍概要决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法,首先对数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。原理决策树从有类标号的训练元组中学习决策树,它采用自顶向下的方法构造。决策树是一种类似与流程图的树结构。其中,每一个内部节点(非树叶节点)在一个属性上进行测试,每一个分支表示该测试

2017-07-17 11:21:00 630

原创 实现kMeans聚类

实现kMeans聚类kMeans算法介绍概要kMeans算法是一种无监督学习聚类算法。优点是易于实现,缺点是可能收敛到局部最小值,且在大规模数据集上收敛较慢,它适用于数值型数据。kMeans算法以k为参数,把n个对象分成k个簇,使簇内具有较高的相似度,簇间相似度较低。原理 随机选择k个点作为聚类中心(质心); 计算每一个样本点与k个聚类中心的距离,并将该样本点归入最近的簇; 计算每个簇的所有点的均值

2017-07-12 08:55:24 592 1

原创 Hadoop伪分布式WARN util.NativeCodeLoader:Unable to load native-hadoop library for your platform...usi

大部分说是操作系统与Hadoop的位数不一致造成的。其实就是你的Hadoop自带的native包过旧,只需要更新一下。 在你的$HADOOP_HOME/lib下,更新nativa包。亲测有效。 链接:http://pan.baidu.com/s/1hs5PDZ2 密码:qptv

2017-05-27 20:29:55 343

原创 ubuntu16.04下eclipse使用 jdbc连接本地mysql出现:Communications link failure错误

具体错误:com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure The last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any pac

2017-05-12 14:56:21 25121 1

转载 tomcat

在安装部署tomcat之前必须先安装好jdk环境 1、先从Apache的官方网站下载下来tomcat6.0系列的文件,http://www.apache.org/tomcat/在这里找到Tomcat的linux安装文件,它跟windows是不一样的,在官网上有相应的说明,linux版的tomcat是需要编译源代码的文件,如下载下来的文件为:apache-tomcat-9.0.0.M20.zi

2017-04-23 22:02:04 206

原创 再次时配置jdk遇到的问题

jdk配置出问题:不存在该文件或目录

2017-03-22 21:00:15 249

原创 ubuntu16.04下安装MySQL-pthon,遇到:EnvironmentError: mysql_config not found问题

命令行下执行:(前提pip已安装合适版本) 1.sudo aptitude install libmysqlclient-dev  (若未安装aptitude,则先执行:sudo apt install aptitude) 2.sudo pip install MySQL-python 本人亲测,通过

2017-02-10 00:23:30 367

转载 Ubuntu 16.04上安装MySQL步

Ubuntu 16.04上安装MySQL步骤: 如果你使用的是Ubuntu 16.04以前的版本,可以看这里:Ubuntu 14.04/15.10升级到Ubuntu 16.04 LTS。 一. 安装MySQL 1. 安装前先更新软件包列表: $ sudo apt update 2. 在Ubuntu 16.04上安装MySQL: $ sudo apt-get instal

2016-12-18 23:00:58 403

原创 Ubuntu16.04下Rstudio和R 安装RWeka、RWekajars、rJava包及JDK安装环境变量配置问题

RStudio/R 无法安装rJava、RWeka、RWekajars包及ubuntu16.04下jdk环境变量配置 首先添加镜像源 # Ctrl+Alt+T打开终端 $ sudo gedit /etc/apt/sources.list # 加入新镜像源 回车之后会自动跳出一个文本框,然后在末尾输入 deb http://cran.rstudio.com/bin/linux/ubunt

2016-12-05 10:42:54 1546

原创 R语言基于KNN算法实现蘑菇毒性识别

R语言:基于KNN算法实现蘑菇毒性识别 平台:Ubuntu16.04LTS   RStudio 数据集介绍: trainData.txt  训练数据集。包含4339个样本(行),每个样本共6个特征(列),其中前5列为蘑菇样本的特征值,第6列为蘑菇的毒性属性,0表示无毒,1表示有毒。(74个样本有毒,4265个样本无毒) testData.txt:  测试数据集。包含500个带测试的

2016-12-02 23:36:06 3960 6

原创 R语言无限制显示输出行数

最大输出行数

2016-11-24 14:33:07 7901

原创 Ubuntu16.04清理boot分区

1.df  -h 查看分区使用率 2.uname -a 查看当前内核版本 3.dpkg --get-selections|grep linux-image 查看boot内所有的内核版本(带有linux-image-的为旧的内核,可以删除) 4.sudo apt-get remove linux-image-(两次tab键) 删除旧版内核。   sudo apt autoremove

2016-11-17 00:14:28 1019

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除