自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

原创 过拟合

过拟合:overfitting欠拟合:underfitting如何防止欠拟合:计算误差如何防止过拟合:计算权重的复杂度折中:trade off

2018-10-19 12:52:25 165

原创 R中三种检验正态分布的方式

一、画出密度函数与正态分布密度图比较:library(MASS)mu<- c(0,0,0)Sigma<- matrix(c(1,0.5,0.25,0.5,1,0.5, 0.25,0.5,1),3,3)M<- mvrnorm(1000, mu, Sigma)d<- density(M[,2])plot(d$x,dnorm(d$x),col=2,type = "n"...

2018-09-26 16:04:20 23574

转载 python 爬虫一

一. 解析方式json 解析直接处理正则表达beautifulsoupPyQueryXpath一般的网页和我们看到的东西不一样是因为用JavasCriptUrllib 详解。python内置HTTP请求库urllib.request 请求模块urllib.error 异常处理模块urllib.parse url解析模块urllib.robotparser 识别哪些网页...

2018-09-26 15:55:45 147

转载 python scrapy2

import requestsfrom requests.exceptions import RequestException #捕捉异常import reimport jsonheaders={ 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like ...

2018-09-24 16:37:13 182

转载 Caret

#practice to use the caret packages#1.variance near to 0 return:a vector of integers corresponding to the column#positions of the problematic predictors.Zero <- nearZeroVar(mdrrDescr)mdrrDescr...

2018-09-19 19:24:26 305

原创 R语言做简单统计图用基础画图工具和ggplot2

R语言画图我一直觉得R语言画的图虽然好看,但是他很费功夫。我也看过一本基本介绍ggplot2包的书籍,他画图的大致规则是做一种类似映射的东西,把变量映射到坐标轴和和颜色或者形状参数上。但是基础画图我觉得很难理解。但我仔细学习发现其实是我不太理解这些图形的意义是啥。密度图有:histagrams,density.柱状图:bar箱型图:box由于这些图形表示的意义不太一样。这和我们数据也有很...

2018-09-19 00:43:59 2568 2

原创 EM算法学习

EM算法迭代在数据缺失,但已知分布的情况下寻求关于θθ\theta 最大化的似然函数。从而找到 θθ\theta 最有可能值。即用这个值来代替 θθ\theta 比如完全样本是 (x1,…,xn)(x1,…,xn)(x_1,\dots ,x_n) 但是我只观测到 (x1,…,xm)(x1,…,xm)(x_1,\dots , x_m) (m<n)(m<n)(m(xm+1,…,xn)(x...

2018-09-12 16:01:49 145

原创 R语言之导入数据

为了防止我考试的时候倒不进去数据,我还是写一点东西以防忘记。file.choose()弹出一个对话框,选择一个文件。返回该文件的地址:x <- read.csv(,encoding="UTF-8")重点参数:stringAsFactors=F不要把字符当成分类变量 encoding=要编码setwd()getwd()设置...

2018-09-12 15:44:02 1119

原创 模拟退火算法的R语言实现

模拟退火算法:原理: 固体在慢慢冷却下来的时候某内部的分子热能一般随机减少。但是在也有可能以boltzmann的概率随机增加。即在温度ττ\tau,能量增加幅度为ΔEΔE\Delta E 的概率密度为exp{−ΔE/kτ}exp{−ΔE/kτ}exp{\{-\Delta E/k\tau\}} 其中kτkτk\tau 是常数。但长时间后一定会以不变的能量存在。伪代码: 1.initial...

2018-09-10 16:29:28 4936 2

原创 局部搜索算法的R语言实现

禁忌算法 禁忌算法是启发式算法对个体的应用的一种。由于在运用最速下降或者最速上升局部搜索最值的时候可能会因为到了局部最小值后停止搜索。这里禁忌算法是一种可以look back的算法,但是需要设置一些禁忌目录来保证搜索不是无限的。 例如:在Baseball salary案例中,我们希望寻找几个与salary最connected的features去做multiple regression所以,...

2018-09-09 00:58:17 2188

原创 SVM

Linear SVM - 这里的loss function max() 是convex的,参数的模*λλ\lambda也是convex但是可以分段微分 R中的kernal function rbfdot(sigma=)polydot(degree=,scale=,offset=)tanhdot(scale=, offset=)vanilladot()laplacedo...

2018-09-07 00:02:19 158

原创 深度学习mnist pythonR对比

先写老师的python 代码model = Sequential()x_train=x_train[1:10000]y_train=y_train[1:10000]model.add(Dense(input_dim=28*28,units=633,activation='relu'))for i in range(10): model.add(Dense(units=63...

2018-09-06 20:22:11 406

原创 纵向数据导入R

数据的样子 纵向数据 数据特点: 信息之间有相关性:信息重叠性强。一共实际的样本量被夸大。 比如:t=x−μse(x)t=x−μse(x)t=\frac{x-\mu}{se(x)}其中se(x)=σ(n)√se(x)=σ(n)se(x)=\frac{\sigma}{\sqrt{(n)}}如果x的样本量很大。t值对应的尾概率p值会很小。得到的结论显著。但是是错误的结论。power a...

2018-09-06 12:05:59 1190 2

转载 如何使用CSDN-markdown编辑器

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...

2018-09-06 10:06:01 138

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除