林大佑Yoo-CSDN博客

原创实现Logistic回归

Logistic回归介绍 logistic回归是研究观察结果为二分类或多分类时，与影响因素之间关系的一种多变量分析方法，属于概率型非线性回归。它的主要是想是根据现有数据对分类边界线建立回归公式，并以此进行分类。通过分类边界线进行分类，具体说来就是将每个测试集上的特征向量乘以回归系数(即最佳拟合参数)，再将结果求和，最后输入到logistic函数(也叫sigmoid函数)，根据sigm

2017-08-03 10:40:18 574

原创实现标准线性回归

介绍线性回归是假设特证满足线性关系，根据给定的训练数据训练一个模型，即回归方程，并用此模型进行预测，回归：求回归系数的过程。具体做法是用回归系数乘以输入值，将结果相加，得到预测值。它是一种针对数值型数据的监督学习方法。特点适用于数值型，如果是标称型或名义型的数据，需要转为数值型数据对于非线性数据拟合较差查看数据分布数据集包含150个样本，每个样本共2个特征，第1个为输入，第2个为结果

2017-07-27 13:00:45 574

ID3决策树算法介绍概要决策树算法是一种逼近离散函数值的方法。它是一种典型的分类方法，首先对数据进行处理，利用归纳算法生成可读的规则和决策树，然后使用决策对新数据进行分析。本质上决策树是通过一系列规则对数据进行分类的过程。原理决策树从有类标号的训练元组中学习决策树，它采用自顶向下的方法构造。决策树是一种类似与流程图的树结构。其中，每一个内部节点（非树叶节点）在一个属性上进行测试，每一个分支表示该测试

2017-07-17 11:21:00 643

原创实现kMeans聚类

实现kMeans聚类kMeans算法介绍概要kMeans算法是一种无监督学习聚类算法。优点是易于实现，缺点是可能收敛到局部最小值，且在大规模数据集上收敛较慢，它适用于数值型数据。kMeans算法以k为参数，把n个对象分成k个簇，使簇内具有较高的相似度，簇间相似度较低。原理随机选择k个点作为聚类中心（质心）;计算每一个样本点与k个聚类中心的距离，并将该样本点归入最近的簇;计算每个簇的所有点的均值

2017-07-12 08:55:24 653 1

原创 Hadoop伪分布式WARN util.NativeCodeLoader:Unable to load native-hadoop library for your platform...usi

大部分说是操作系统与Hadoop的位数不一致造成的。其实就是你的Hadoop自带的native包过旧，只需要更新一下。在你的$HADOOP_HOME/lib下，更新nativa包。亲测有效。链接：http://pan.baidu.com/s/1hs5PDZ2 密码：qptv

2017-05-27 20:29:55 359

原创 ubuntu16.04下eclipse使用 jdbc连接本地mysql出现：Communications link failure错误

具体错误：com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failureThe last packet sent successfully to the server was 0 milliseconds ago. The driver has not received any pac

2017-05-12 14:56:21 25176 1

转载 tomcat

在安装部署tomcat之前必须先安装好jdk环境1、先从Apache的官方网站下载下来tomcat6.0系列的文件，http://www.apache.org/tomcat/在这里找到Tomcat的linux安装文件，它跟windows是不一样的，在官网上有相应的说明，linux版的tomcat是需要编译源代码的文件，如下载下来的文件为：apache-tomcat-9.0.0.M20.zi

2017-04-23 22:02:04 213

原创再次时配置jdk遇到的问题

jdk配置出问题：不存在该文件或目录

2017-03-22 21:00:15 284

原创 ubuntu16.04下安装MySQL-pthon,遇到:EnvironmentError: mysql_config not found问题

命令行下执行：（前提pip已安装合适版本）1.sudo aptitude install libmysqlclient-dev (若未安装aptitude，则先执行：sudo apt install aptitude)2.sudo pip install MySQL-python本人亲测，通过

2017-02-10 00:23:30 379

转载 Ubuntu 16.04上安装MySQL步

Ubuntu 16.04上安装MySQL步骤:如果你使用的是Ubuntu 16.04以前的版本，可以看这里：Ubuntu 14.04/15.10升级到Ubuntu 16.04 LTS。一. 安装MySQL1. 安装前先更新软件包列表：$ sudo apt update2. 在Ubuntu 16.04上安装MySQL：$ sudo apt-get instal

2016-12-18 23:00:58 414

原创 Ubuntu16.04下Rstudio和R 安装RWeka、RWekajars、rJava包及JDK安装环境变量配置问题

RStudio/R 无法安装rJava、RWeka、RWekajars包及ubuntu16.04下jdk环境变量配置首先添加镜像源# Ctrl+Alt+T打开终端$ sudo gedit /etc/apt/sources.list# 加入新镜像源回车之后会自动跳出一个文本框，然后在末尾输入deb http://cran.rstudio.com/bin/linux/ubunt

2016-12-05 10:42:54 1570

原创 R语言基于KNN算法实现蘑菇毒性识别

R语言：基于KNN算法实现蘑菇毒性识别平台：Ubuntu16.04LTS RStudio数据集介绍：trainData.txt 训练数据集。包含4339个样本（行），每个样本共6个特征（列），其中前5列为蘑菇样本的特征值，第6列为蘑菇的毒性属性，0表示无毒，1表示有毒。（74个样本有毒，4265个样本无毒）testData.txt: 测试数据集。包含500个带测试的

2016-12-02 23:36:06 4047 6

原创 R语言无限制显示输出行数

最大输出行数

2016-11-24 14:33:07 8024

原创 Ubuntu16.04清理boot分区

1.df -h查看分区使用率2.uname -a查看当前内核版本3.dpkg --get-selections|grep linux-image查看boot内所有的内核版本（带有linux-image-的为旧的内核，可以删除）4.sudo apt-get remove linux-image-（两次tab键）删除旧版内核。 sudo apt autoremove

2016-11-17 00:14:28 1056

qq_34763004的博客