随笔
Dream-YH
加油!
展开
-
验证系列-机器学习中,为什么要进行数据标准化或者归一化?
机器学习中,为什么要进行数据标准化或者归一化?应用条件原理分析实例佐证应用条件我们在翻阅各种资料时,在数据预处理步骤,经常会看到对数据进行标准化或者归一化,那么这么做的好处是什么?1、这样处理后加快了梯度下降求最优解的速度;2、有可能提高精度;但是,理解这句话后,你会发现,这是有应用条件的,即:1、适用于用梯度下降法求参数的算法;2、适用于基于距离的算法;比如树模型这种基于概率的,是没有作用的。原理分析1、为什么这样处理后加快了梯度下降求最优解的速度?原因很简单,比如我们有这样一个2元原创 2020-12-09 02:28:02 · 3826 阅读 · 0 评论 -
代码系列-pandas如何在一次操作中,往同一张Excel表里面,插入多个sheet数据?
pandas如何在一次操作中,往同一张Excel表里面,插入多个sheet数据?问题点解决方案问题点import pandas as pdimport numpy as np通常情况下,我们想把一个数据插入到Excel表中,data_1.to_excel(r’…\xx.xlsx’,sheet_name = ‘测试1’)data_2.to_excel(r’…\xx.xlsx’,sheet_name = ‘测试2’)这样,一个Excel里面会同时存在2个sheet:一个叫’测试1’,一个叫’测试原创 2020-12-09 00:46:11 · 661 阅读 · 1 评论 -
代码系列-python实现PolynomialFeatures(多项式)
python实现PolynomialFeatures(多项式)sklearn生成多项式Python生成多项式sklearn生成多项式import numpy as npfrom sklearn.preprocessing import PolynomialFeatures #这哥用于生成多项式x=np.arange(6).reshape(3,2) #生成三行二列数组reg = PolynomialFeatures(degree=3) #这个3看下面的解释reg.fit_transform原创 2020-12-03 00:55:13 · 6166 阅读 · 8 评论 -
踩坑系列-字符编码OneHotEncoder
OneHotEncoder今天想起来,之前应用OneHotEncoder存在的问题,这里和大家分享一下。OneHotEncoder又被称为独热编码,什么意思呢,就是1、每一列特征需要构建的状态寄存器的位数等于该列特征独立取值的个数;2、使用N位状态寄存器来对N个状态进行编码,每个状态都由他独立的寄存器位,并且在任意时候,其中只有一位有效。到底在说什么呢?请看下面的代码演示就明白了(以下代码在jupyter notebook里执行)import numpy as npimport pandas原创 2020-12-02 23:27:16 · 2429 阅读 · 0 评论 -
验证系列-线性回归、逻辑回归问题中对X添加偏置x0=1,对于最终系数到底有没有影响?
线性回归、逻辑回归问题中对X添加偏置x0=1,对于最终系数到底有没有影响?验证:线性回归中添加偏置验证:逻辑回归中添加偏置验证:线性回归中添加偏置利用sklearn生成如下回归数据集:import numpy as npimport pandas as pdfrom sklearn import datasets #sklearn生成数据集都在这里from matplotlib import pyplot as plt#生成一个特征的回归数据集x,y=datasets.make_re原创 2020-12-02 22:37:35 · 1738 阅读 · 3 评论