自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 Redis取值报错

但是redis在取值时报错UnicodeDecodeError: 'utf-8' codec can't decode byte 0x80 in position 0: invalid start byte。时,库会尝试将接收到的字节数据(bytes)解码为字符串(str),通常使用 UTF-8 编码。将decode_responses改为False(默认)redis保存了训练好的模型。

2024-09-25 11:24:57 176

原创 python类自学教程(小白易懂版)

python中的类是一种封装好的方法,我们可以使用这个方法去建立许多的实例。就好比类是建筑草图,那我们可以根据这张草图盖出很多栋房子(实例)。是一个类的所有不同对象/实例共享的变量。是每个实例唯一的变量。你在构建实例时输入这些变量,那么这些变量就定义了一个实例,有点类似初始化。也称为函数,它们在类中定义并描述对象的行为我创建了一个类构建了一个名字叫yeye,5岁,80斤的萨摩耶(实例)构建了一个叫la_pig,,3岁,100斤的拉猪(实例)萨摩耶和拉猪这两个实例的科目都是Canine。

2024-08-30 14:14:32 319

原创 ARIMA时序预测万能模板

这里我挑选最佳参数是根据赤池信息准则和贝叶斯信息准则的均值,也可以自行查看输出的aic_bic_df来挑选最佳参数。早就知道ARIMA这个算法,但以前只会用来简单做个预测,对于参数选择,什么拖尾截尾一知半解,借着这次重新学一下ARIMA的原理,梳理一下使用ARIMA做时序预测的流程。原理部分我是看了一篇知乎文章,讲的非常全面,我看了这篇文章感觉才懂,墙裂推荐给大家。自己拿了一个手边的数据梳理了一下arima做预测的一个典型流程吧,这个代码模板无脑用。好啦,就是这样,希望能帮到有需要的伙伴!

2024-08-29 16:19:43 353

原创 学习动态规划——最长公共子串和最长公共子序

比如:fish和fosh,最长公共子串长度为2,即sh;但是最长公共子序长度为3。最长公共子序:个人理解为两个字符串中,相同元素个数,这些元素的排列顺序要相同。reference:《算法图解》,这本书很好理解,漫画风,算法入门很不错。本人初学者,如果有表述不准确的内容欢迎大家指正。最长公共子串:两个字符串中,

2024-07-31 11:32:46 128

原创 机器学习python实践(七)自动流程Pipeline

Pipeline能够处理训练数据集和评估数据集之间的数据泄露问题,通常会在数据处理过程中对分离出的所有数据子集做同样的数据处理,如正态化处理。在sklearn中通过Pipeline来定义和自动化运行某些标准流程。reference:《机器学习python实践》魏贞原,2018.特征选择也是一个容易受到数据泄露影响的过程。2. 特征选择和生成模型的pipeline。1.数据准备和生成模型的Pipeline。

2023-02-19 21:44:06 338

原创 机器学习python实践(六)算法评估,如何选择最佳的机器学习算法

混淆矩阵主要用于比较分类结果和实际测得值,可以把分类结果的精度显示在一个混淆矩阵中。混淆矩阵是可视化工具,特别适用于监督学习,在无监督学习时一般叫做匹配矩阵。通过放弃最小二乘法的无偏性,以损失部分信息、降低精度为代价,获得回归系数更符合实际、更可靠的回归方法。ROC是反映敏感性和特异性连续变量的综合指标,AUC是ROC曲线下的面积。AUV的值越大,诊断准确性越高。敏感性指标,又称为真正类率: sensitivity=TP/(TP+FN)特性性指标 specificity=TN/(FP+TN)=1-FPR。

2023-02-19 20:59:58 347

原创 机器学习python实践(五)数据集划分

要知道算法模型对未知的数据表现如何,最好的评估方法是利用已经明确知道结果的数据运行生成的算法模型进行验证。弃一交叉验证和重复随机分离评估数据集与训练数据集这两种方法,通常会用于平衡评估算法、模型训练的速度及数据集的大小。将原始数据集分成K组,每个子集数据分别做一次验证集,其余K-1组做训练集,得到K个模型。分离训练集和数据集方法的执行效率比较高,多用于算法执行效率比较低或者具有大量数据的时候。原始数据N个样本,弃一交叉验证就是N-1个交叉验证,每个样本单独作为验证集得到N个模型。2. K折交叉验证分离。

2023-02-19 15:43:54 558

原创 机器学习python实践(四)特征选择

特征选择方法

2023-02-19 14:27:54 288

原创 机器学习Python实践(三)数据转换方法-调整数据尺度,正态化,标准化,二值数据

数据转换方法:调整数据尺度,正态化,标准化,二值数据

2023-02-19 11:54:54 633

原创 机器学习python实践(二)鸢尾花分类

利用鸢尾花数据集实现一个分类的小项目,评估六种不同的算法:LR;线性判别分析LDA;K近邻KNN;分类与回归树CART;贝叶斯分类器BN;SVM

2023-02-17 18:59:42 616 1

原创 机器学习python实践(一)

监督学习:在机器学习过程中提供对错指示。数据是有标签的,在学习过程中,有“标准答案”供参考。主要用于分类和预测。非监督学习,又称为归纳性学习,在机器学习过程中没有对错指示。

2023-02-17 15:40:57 161

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除