自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(9)
  • 收藏
  • 关注

原创 统计学习基础——第七章 非线性模型

目录一、多项式回归1、定义(1)特点(2)与线性回归模型的异同二、阶梯函数1、定义2、作用3、与分段函数区别4、步骤三、基函数1、原理四、回归样条1、分段多项式(1) 定义(2)结点2、约束条件与样条(1)约束条件的作用(2)样条3、样条基函数(1)定义(2)截断幂基函数(3)自然样条四、确定结点个数和位置1、结点位置2、结点个数五、与多项式回归对比1、回归样条得到的结果比多项式回归更好。2、

2021-12-08 01:38:32 1737

原创 统计学习基础——第六章 线性模型选择与正则化

标准线性回归模型:参数估计方法:最小二乘法。不足:预测准确率不高,模型解释力不足。预测准确率:若响应变量和预测变量真实关系近似线性,则最小二乘的偏差较低;若n远大于p,则最小二乘的方差也较低; 若不满足n远大于p,则使用最小二乘可能导致过拟合; 若p>n,则最小二乘得到的系数估计结果不唯一:此时方差无穷大,无法使用最小二乘法。模型解释力(解释效果):将无关变量的系数设置为0,并移除这些无关变量(去不相关),但最小二乘法很难将系数置为0。改进方法:子集选择、压缩估计、降维法。一

2021-12-06 19:37:09 1553

原创 统计学习基础——第五章 重抽样

目录一、重抽样1、概念2、用途3、缺点4、方法二、交叉验证法(CV)1、验证集方法(1)原理(2)评价指标:均方误差(3)缺陷2、留一交叉验证法(LOOCV)(1)原理(2)优缺点(3)拟合方法3、k折交叉验证法(一般k=5或k=10。)(1)原理(2)优缺点(3)改进4、k折交叉验证的偏差——方差权衡二、自助法1、作用2、原理 当数据信息充分时,我们直接分好训练集跟测试集进,再建立模型进行拟合,最后得...

2021-11-29 01:33:59 2168

原创 统计学习基础--第四章 分类

目录一、逻辑斯谛回归(logistic)1、Logistic模型(1)概率(2)逻辑斯谛函数(3)注意2、估计回归系数(1)方法:极大似然估计(2)似然函数(3)预测(4)多元逻辑斯谛回归二、线性判别分析(LDA)1、贝叶斯判别分析2、p=1的线性判别分析(1)p=1:只有一个预测变量(2)思路(3)假设(4)参数估计3、p>1的线性判别分析4、二次判别分析(QDA)三、分类器评价指标1、灵敏度、特异度2、RO..

2021-11-08 20:27:57 1094

原创 统计学习基础--第三章 线性回归

一、简单线性回归1、表达式2、估计系数(1)方法:最小二乘法(2)实质:(3)结果(4)评估系数估计的准确性(5)评估模型的准确性方法一:RSE(对模型失拟的度量,越小越好)方法二:统计量(越接近1越好)二、多元线性回归...

2021-11-04 01:12:14 937

原创 统计学习基础--第一、二章 导论

一、data的理解 我们把data分为训练集和测试集,其中训练集用于建立模型,通常要占data的80%;而测试集则是用于预测分析,观察拟合出的模型的效果。二、数据预处理1、处理数据文件格式;2、观察数据是否有缺失值或异常值;3、是否需要对数据做归一化等处理;4、是否需要降维。三、算法1、有监督学习(有人的干预)(x1,y1)…(xn,yn)中,y1,y2,…,yn等价于标签,即人为的分类,而xN+1、yN+1表示不带标签,类型未知。,其中argmax表...

2021-11-01 23:40:39 421

原创 泰坦尼克号入门学习(思维导图)

import numpy as npimport pandas as pd import seaborn as sns from sklearn import metricsimport matplotlib.pyplot as pltdata=pd.read_csv(r'C:\Users\BX田田\Desktop\数据挖掘\Titanic\data.csv',encoding='UTF-8')#data.csv是泰坦尼克的训练集数据data['Age']=data['Age'].fil...

2021-10-25 22:06:05 1004

原创 python爬取东方财富网历史资金流向(已存入MySQL)

from selenium import webdriver #导入模块,selenium导入浏览器驱动,用get方法打开浏览器import timeimport reimport csv #存储数据from lxml import etree #数据的解析import pandas as pdimport numpy as npoption = webdriver.ChromeOptions() #网址获取option.add_argument('headless') #无界面.

2021-10-19 01:42:13 1444

原创 python爬取东方财富网资金流向数据(在本地生成csv文件)

今天我们来试着用python爬取东方财富网资金流向的表格数据。第一步:程序及应用的准备首先我们需要安装selenium库,使用命令pip install selenium;然后我们需要下载对应的chromedriver,安装网址:http://chromedriver.storage.googleapis.com/index.html,安装教程:Windows下载及安装chromedriver.exe_mry6的博客-CSDN博客_chromedriver.exe。我们的chromedriver.e

2021-10-18 22:23:35 6131 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除