数据建模
fitzgerald0
太阳出来的时候尽管我帮不上忙,此时唯一重要的是,日出时有你在场。
展开
-
使用python进行ridge回归
上文我们诊断出,三个自变量之间存在共线性,那么,我们使用先使用岭回归。#岭回归,是一种专用于共线性数据分析的有偏估计回归方法,实质上是一种改良的最小二乘估计法,#通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价获得回归系数更为符合实际、更可靠的回归方法,#对病态数据的拟合要强于最小二乘法。原创 2017-07-16 20:33:32 · 9889 阅读 · 0 评论 -
python数据描述(1)
1.读取数据import pandas as pddata=pd.read_csv('CTGNM.csv')columns= data.columns.tolist()columns # 显示变量信息['LB', 'AC', 'FM', 'UC',2 .更详细的信息data.info()如下:RangeIndex: 2126 ent原创 2017-08-29 16:19:58 · 2333 阅读 · 0 评论 -
使用R对共线性检验
简介:本系列文章属于原创,转载请标明出处!感谢本系列打算,先从最基本的模型开始,对模型存在的共线性诊断,使用ridge lasso 以及box-cox指数转换然后使用python进行交叉验证,以及在大数据时代被遗忘的spss中相应的功能,做一个对比。本文属于建模回归系列的第一篇。 高维数据常会出现共线性 、变量选择等问题 。原创 2017-07-16 20:15:11 · 15744 阅读 · 0 评论 -
牛顿-拉夫逊简单解释
核心:牛顿-拉夫逊法在数学上是求解非线性代数方程式的有效方法。其要点是把非线性方程式的求解过程变成反复地对相应的线性方程式进行求解的过程,即通常所称的逐次线性化过程。将非线性代数方程组 (1) 在待求量 的某一个初始估计值 附近,展开成泰勒级数并略去二阶原创 2017-10-23 22:38:14 · 14865 阅读 · 0 评论 -
出现“cannot identify image file '/Users//.DS_Store'”问题的解决办法
“cannot identify image file '/Users//.DS_Store'”在用mac跑深度学习tensorflow框架是制作图片格式向tfrecord格式转化中,读取文件夹中的图片出现系统文件时候报错,提示有.DS_Store系统文件。最简单的办法就是删除,之前在网上找了有些办法不太适用,要么是删除内存中所有的.DS_Store文件,显然在这里是小题大做了,...原创 2017-12-21 21:09:23 · 9149 阅读 · 12 评论 -
PIL批量对图片进行转换(RGB-->Gray)
Image模块中主要有八种模式,分别为1,L,P,RGB,RGBA,CMYK,YCbCr,I,以往很多博客都是对一张图片做转换,本文简单的读取文件夹中的图片,做颜色通道的转换,可以改改做其他的尝试。from os.path import splitextimport globfrom PIL import Image def get_file(filename): file原创 2018-01-06 11:40:02 · 8574 阅读 · 0 评论 -
多元线性模型中共线性产生的原因解析
在很多书籍中谈到了共线性问题,作为多元统计中基本假设之一,却经常被违背,影响模型稳定性和统计power。在不少的论文中谈到了,国内的很多书籍往往一笔带过。因为,属于统计计算领域内容,非专业人士,也鲜有能明白其中内涵,现依据手上的一些资料和自己的理解,写就一些。一.共线性概念共线性问题(collinearity),是指两个或者更多的自变量高度相关,当只有两个高度相...原创 2019-12-02 20:05:28 · 20245 阅读 · 3 评论