自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 【已解决】Pycharm:卡顿解决方案汇总

本机测试在 MAC,Windows、Linux也有相应的设置,请自行查询。

2024-06-26 17:29:20 2690

原创 【已解决】Qwen2:KeyError: ‘qwen2‘

Transformer版本过低,需要升级版本。

2024-06-19 11:01:56 1232

原创 【时序预测】-Transformer系列

核心:Transformers的时序性较差,且embedding忽略变量间物理关联,而D-Linear(Decomposition-Linear),用于处理具有趋势和季节性模式的数据能够获得同样好的结果。核心:与Autoformer类似,在拆分趋势线和季节项的基础上,FEDformer使用傅里叶变换以及小波变换去加速attention模块。重点:Transformer + Patch(源于计算机视觉Vision Transformer)重点:Transformer + 趋势季节分解(基于频域)

2024-06-19 06:00:00 599

原创 使用sklearn进行集成学习——理论

磨刀不误砍柴功,我们花了这么多时间来学习必要的理论,我强调一次:必要的理论!集成学习模型的调参工作的核心就是找到合适的参数,能够使整体模型在训练集上的准确度和防止过拟合的能力达到协调,从而达到在样本总体上的最佳准确度。有了本文的理论知识铺垫,在下篇中,我们将对Random Forest和Gradient Tree Boosting中的每个参数进行详细阐述,同时也有一些小试验证明我们的结论。

2018-02-27 10:14:13 475 1

原创 特征选择:常见方法总结

特征选择方法目的:减少特征数量、降维,使模型泛化能力更强,减少过拟合增强对特征和特征值之间的理解方法:一、方差选择法。(from sklearn.feature_selection import VarianceThreshold) a. 特征值需为离散型变量,若是连续型,需要连续变量离散化。b. 最简单。实用性差。可作为特征选择预处理。 问:为什么方差

2018-01-26 15:15:53 1008

原创 特征构建:生成多项式特征

机器学习,一些比赛竞赛中,通常会给一定的特征数据进行分类或者回归预测。有时需要构建更多的特征,然后对特征再进行特征选择。通过增加一些输入数据的非线性特征来增加模型的复杂度通常是有效的。一个简单通用的办法是使用多项式特征,这可以获得特征的更高维度和互相间关系的项。这在 PolynomialFeatures 中实现:>>> import numpy as np>>> from sklea

2018-01-25 23:44:59 8121

原创 调用itchat模块实现微信自动回复

调用itchat模块,以及图灵机器人接口实现微信自动回复步骤:(1)电脑端需要装好Python(2)命令端 'pip install itchat  '           #安装itchat模块(3)复制以下代码并保存为'test.py' #后缀为 .py#coding=utf8import requestsimport itchatKEY = '3104727d87f7

2018-01-10 15:38:36 2750

原创 Boosting算法学习

(1)提升算法(Boosting)是常用的有效的统计学习算法,属于迭代算法,它通过不断地使用一个弱学习器弥补前一个弱学习器的“不足”的过程,来串行地构造一个较强的学习器,这个强学习器能够使目标函数值足够小。(2)Bagging也是一种常用的统计学习方法,两者经常放在一起对比,它们不同的是,Bagging将在Bootstrap采样得到的不同训练子集上的弱学习器的结果综合考虑,各个弱学习器的构建过

2018-01-08 17:11:37 679

原创 scikit-learn 线性回归算法库小结

本文内容主要来自这篇文章。scikit-learn对于线性回归提供了比较多的类库,这些类库都可以用来做线性回归分析,本文就对这些类库的使用做一个总结,重点讲述这些线性回归算法库的不同和各自的使用场景。    线性回归的目的是要得到输出向量YY和输入特征XX之间的线性关系,求出线性回归系数θθ,也就是Y=XθY=Xθ。其中YY的维度为mx1,XX的维度为mxn,而θθ的维度为nx1

2018-01-06 21:09:13 454 1

原创 Pandas常用基本操作(整理)

一、查看数据(查看对象的方法对于Series来说同样适用)1.查看DataFrame前xx行或后xx行a=DataFrame(data);a.head(6)表示显示前6行数据,若head()中不带参数则会显示前5行数据。a.tail(6)表示显示后6行数据,若tail()中不带参数则会显示后5行数据。2.查看DataFrame的index,columns以及valuesa.inde

2018-01-06 16:33:56 2345

原创 hosts in ipv6 (自/不定期更新)

(*注)仅用于学术交流。不定期更新。仅自用。windows:C:\Windows\System32\drivers\etc\hostslinux:/etc/hostsmac:/etc/hosts链接: https://pan.baidu.com/s/1o7EvWMm密码: 2c9b

2017-12-15 11:09:47 27309 3

翻译 Linux系统下的20个常用命令(初)

Linux系统下的20个常用命令(初)

2017-12-05 13:04:53 2743 2

原创 Ubuntu中apt-get install安装软件,显示“E:无法定位软件包”

问题:一般为刚装完Linux  Ubuntu系统,若直接使用apt-get install安装软件,总是显示“E:无法定位软件包”。解决:可能的一个原因是因为系统没有更新软件源,更新一下软件源。命令:sudo apt-get update

2017-12-04 22:45:40 16796 1

转载 在windows下安装windows+Ubuntu16.04双系统(下)

这篇文章的内容主要来源于这篇文章,为正式安装windows+Ubuntu16.04双系统部分。在正式安装前,若还没有进行前期准备工作(1.分区2.制作启动u盘),见《在windows下安装windows+Ubuntu16.04双系统(上)》

2017-11-30 20:16:57 2710

转载 在windows下安装windows+Ubuntu16.04双系统(上)

这篇文章的内容主要来源于这篇文章,给文章很详细的介绍了如何从windows下安装windows+ubuntu16.04双系统。我刚开始装双系统都是参照这个方法,该作者前后更新了两个版本,在这里对其稍微进行整理一下。一、准备:(这里推荐用u盘装系统,不推荐用硬盘方式装)(一)、准备工具:   ➢U盘一个(请提前备份U盘里面的资料,因为后面操作要格式化U盘)

2017-11-29 16:59:01 3521

转载 关于python中的字符串编码

本文主要参考了这篇文章,该文章主要针对python编程中常见到的字符串编码问题进行比较详细的介绍,以及 python2 和 python3 中的区别。字符编码因为计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制 11111111 = 十

2017-11-29 15:30:15 2936

原创 机器学习中数据采样方式

当机器学习中样本比例不平衡时,通常会对数据进行采样的方法,对数据采样可以有针对性地改变数据中样本的比例,采样一般有两种方式:over-sampling 和under-sampling,前者是增加样本数较少的样本,其方式是直接复制原来的样本,而后者是减少样本数较多的样本,其方式是丢弃这些多余的样本。通常来说,当总样本数目较多的时候考虑under-sampling,而样本数数目较少的时候考

2017-11-21 19:59:08 6286

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除