机器学习
文章平均质量分 89
机器学习相关内容
数虫
这个作者很懒,什么都没留下…
展开
-
KMeans聚类之降维----矢量化应用
KMeans是聚类算法的典型代表,也是最简单的聚类算法;在KMeans算法中,簇的个数K是一个超参数,需要我们人为输入来确定。KMeans的核心任务就是根据我们设定好的K,找出K个最优的质心,并将离这些质心最近的数据分别分配到这些质心代表的簇中去。KMeans算法的时间复杂度:KMeans算法的平均复杂度是O(k*n*T),其中k是我们的超参数,所需要输入的簇数,n是整个数据集中的样本量, T是所需要的迭代次数(相对的,KNN的平均复杂度是O(n))。原创 2023-05-07 16:09:08 · 348 阅读 · 0 评论 -
时间序列异常值检测---Prophet算法
Prophet由facebook开源的基于python和R语言的数据预测工具,基于时间和变量值结合时间序列分解和机器学习的拟合来做的;可以解决大部分的实际场景中的对单项值的预测,也可以用于时间序列数据的异常值检测以及缺失值填充;一般会把时间序列拆分成几个部分,分别是s(t)季节项:表示周期项,或者称为季节项,一般以周者年为单位;趋势项g(t):表示时间序列在非周期上面的变化趋势;假期项h(t):表示在当天是否存在节假日;剩余项εt表示误差项或者称为剩余项;原创 2023-05-05 15:53:31 · 1185 阅读 · 0 评论 -
时间序列聚类
时间序列聚类:一种将时间序列数据分为不同组的无监督学习方法。聚类方法旨在找到数据中相似的子集,并将它们归为同一组。对于时间序列数据而言,聚类技术可以发现有相似特征的序列,并将它们划分为同一组,这有助于数据的分类和分析。时间序列聚类包括两种类型:子序列聚类和时间点聚类。子序列聚类是通过滑动窗口在一个时间序列中提取的一系列子序列上的聚类;时间点聚类基于时间点的时间接近度和对应值的相似性组合的聚类。时间序列聚类通常使用常见的聚类算法,如K-means、Ksahpe 、层次聚类等。原创 2023-04-27 15:36:16 · 4680 阅读 · 2 评论 -
时间序列数据预处理
时间序列数据是指按照时间顺序排列的一系列数据点或观测值,通常用于描述某个变量随时间的变化情况。例如,股价、气温、人口数量等都可以被视为时间序列数据。时间序列数据的预处理是进行时间序列分析的重要步骤。原创 2023-04-11 14:23:09 · 4201 阅读 · 0 评论