Pyts
文章平均质量分 92
XINFINFZ
24岁。毕业于武汉大学心理学本科。
展开
-
Pyts入门之时间序列的分解---奇异谱分析(七)
简介Pyts库针对时间序列的分解,只有一种算法,即奇异谱分析(Singular Spectrum Analysis),它能将时间序列分解为趋势和噪音两部分,它的名字的由来和奇异值分解有关,实际上SSA的实质就是将协方差矩阵进行奇异值分解(singular value decomposition),再对得到的奇异值进行谱分析变换,所以它的算法包含以下过程(由于比较复杂,此处简要叙述重点,如需详情请自行查看wiki或者搜索引擎):1.嵌入矩阵(embedding),或者其实就是我们之前学过的窗口变换,把时间原创 2022-03-31 13:53:46 · 3122 阅读 · 4 评论 -
Pyts入门之时间序列的分类---TimeSeriesForest算法介绍(五)
简介时间序列的分类算法逐渐接近尾声,本节将介绍TimeSeriesForest算法,即应用在时间序列上的随机森林算法,同时下一节也就是最后一节将介绍建立在它基础上的TSBF算法。在学习本节之前呢,需要各位将Pyts升级至最新版本(到本文发表时为0.12.0),因为0.11.0(去年10月我安装的版本)是没有这两种算法的:pip install --upgrade pytsTimeSeriesForest的算法步骤分为以下两步:1.从一系列随机窗口序列中提取三个特征:平均值,标准差,和简单线性回归的原创 2022-03-17 12:00:01 · 4385 阅读 · 2 评论 -
Pyts入门之时间序列的分类---理解LearningShapelets算法(四)
简介本章节直接跳过了BOSSVS算法,因为BOSSVS和SAX-VSM的区别也就只在于前面数据预处理的方式了,SAX-VSM用的是分箱的字词转换,而BOSSVS用的是Symbolic Fourier Approximation(详见第一节,本文不再赘述)也就是使用傅里叶变换的提取特征方法,所以与其介绍一遍差不多的,不如留给读者自行探索。那么本节我将给各位介绍pyts中的LearningShapelets算法,来自于14年的“Learning Time-Series Shapelets”这篇文章,本算法过原创 2022-03-10 10:12:03 · 4464 阅读 · 0 评论 -
pyts入门之时间序列的简单特征提取(一)
简介pyts简单的说就是打包了多种时间序列分类和处理算法的类scikit-learn库,国内介绍该库的文档相对较少,所以本人打算开一个新坑,在学习的同时结合自身的理解介绍pyts库的主要api和功能。那么在进入正题前先介绍一下pyts的基本概念,定义时间序列(x1,x2,x3…,xn),如果一个时间序列只有一个特征,那么xi属于实数集R,该时间序列为单变量时间序列,如果一个时间序列有多个特征,那么xi属于R^d,d指维度,xi为一个d维向量,该时间序列为多元时间序列(比如一串GPS就有纬度和经度两个坐标原创 2021-11-05 14:32:31 · 7298 阅读 · 4 评论 -
Pyts入门之时间序列的分类---K近邻算法及调参小技巧(二)
简介书接上文(2021.11.05),在介绍了pyts的时间序列简单特征提取之后,我们来介绍一下对时间序列的分类算法,从KNN(k-nearest neighbors)算法开始,一篇文章介绍一个分类算法。因为工作上的一些烦心事情,最近一直都没写文章,可能关注我的小伙伴都忘了为啥关注我,实在抱歉,那么我们进入正题,首先需要先对KNN算法(分类)有个大概的了解:1.它不是K-means算法(K-means是无监督的聚类算法,新手经常会把它们搞混)。2.它是监督学习(supervised learning)原创 2022-02-28 13:48:24 · 1570 阅读 · 0 评论 -
Pyts入门之时间序列的分类---SAX-VSM算法详解(三)
简介相信不少人会被这个标题唬住,什么叫SAX-VSM算法,其实并不难,容我细细道来。首先它来自2013年的"SAX-VSM: Interpretable Time Series Classification Using SAX and Vector Space Model"这篇论文,全称为Symbolic Aggregate approXimation in Vector Space Model(在向量空间模型中进行符号聚合近似),其实就是先进行符号聚合近似(SAX),再进行词向量的转换(VSM),细心原创 2022-03-02 15:56:59 · 1712 阅读 · 0 评论