自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 机器学习(三)K-means聚类(手肘法、轮廓系数、可视化代码)

k-means聚类和手肘法、轮廓系数、介绍和结果可视化代码

2023-01-06 17:31:12 4531

原创 机器学习(二)降维(PCA,kPCA,LLE)

投影是最简单的降维方法,即将所有训练实例垂直投影到子空间上,可以简单理解为把这个图形拍扁形成的图像,就像小学画三视图一样。

2022-12-12 19:32:24 921

原创 第十届“泰迪杯”B题论文及代码

第十届“泰迪杯”论文和代码

2022-06-29 16:11:46 605 4

原创 机器学习(一)标准方程与LinearRegression详解

线性回归一值是一个较为简单且常用的算法模型之一,那么实现线性回归一般有一下两个方法,一个是标准方程,一个是直接调用skLearn里的linearegression方法。两者究竟有何异同呢?目录1.标准方程1.1标准方程代码实现2.sklearn中LinearRegression首先我们先要了解一下这两种方法的实现过程以及相关原理1.标准方程衡量线性回归模型好坏的标准我们通常选用RMSE,但是由于它要开根号计算不如MSE简单,所以在这就用Mse来当作损失函数,如下给出的是mse

2022-05-20 13:40:41 587

原创 复习pandas基础(三)索引

索引这个非常重要但是往往被忽略的小东西,今天专门写一篇来记录一下。1.索引器1.1iloc1.2loc2.query 查询3.修改删除索引索引1.1iloc是按照位置来索引的1.2loc按照元素来索引2.query主要用于查询...

2022-05-10 16:09:28 172

原创 第十届“泰迪杯”比赛B题解题思路及代码论文

今年大二,因为对编程感兴趣入坑,算下来自学编程快要一年了,了解了关于计算机的很多方向,暑假偶然间了解到数据分析和挖掘,觉得挺有趣的就想深入学习以下,于是开始学习pandas,然后机器学习,并在天池上做了几个小项目。误打误撞了解到有泰迪杯这个比赛,本着以赛促学,积累经验为目的就去参加了。主要分为以下四个点来说;目录1.队友选择3.题目选择3.比赛过程4.解题思路5.总结1.队友选择方面因为是第一参加也没经验,没有意识到队友的重要性,就随便找了一个没有经验的的队友,所以比

2022-05-08 21:47:34 3346 8

原创 OSError: [WinError 126] 找不到指定的模块DLL load failed: 找不到指定的模块。导入numpy出现错误

安装一个新版本的python,发现导入库错误,原因如下安装numpy库的顺序出现错误解决方法:如果你有pandas了先卸载掉pip install wheelpip install numpy重新下pandas

2022-05-07 17:30:30 315

原创 复习pandas基础(二)重要函数

python基础函数和pandas内置函数能够给我们提供很多方便,但是很容易混淆和忘记。所以在这里做一个总结1.python基础函数1.1 lambda函数lambda函数用于处理简单映射关系result=lambda x :x**2 result(2)lambda函数类似于def但是它比def方法更加简单便捷,如果不需要复用这个函数或者函数映射关系比较简单,那么这是一个不错的选择。1.2 map函数...

2022-05-05 22:16:49 76

原创 复习pandas基础(一)基本数据结构

最近做简单项目发现自己pandas基础不是很好,所以写一篇帮助自己复习的博客。以下都是pandas比较重要的基础知识。目录1.基本数据机构1.1series1.2DataFrame2.取出相应的元素1.基本数据机构pandas主要有两个数据结构,一个是Series一个是DataFrame,其中DataFrame可以理解为是多个Series的组合。 具体代码实现如下1.1seriesSereis是一列 ...

2022-05-04 23:04:58 952

原创 Auto-ARIMA实战

传统机器学习ARIMA模型是一种随机时序分析,其实质是差分运算和ARMA模型的组合,但由于ARIMA模型需要调整的参数比较多且网格寻优速度比较慢,所以Auto-ARIMA应运而生。由于Auto-ARIMA只需自定义参数范围并自己寻找最佳参数。所以其实是比较容易实现的。但是它的预测精度其实是不如用ARIMA手动寻找的精度高的,但是由于其方便快捷,其实还是有一定的可用性。废话不多说直接上代码model = pm.auto_arima(x_train["y"], start_p=1, s..

2022-05-01 17:23:15 2241

原创 解决安装prophet失败问题全套教程(anaconda)

最近做的项目需要安装prophet,参考了很多教程,安装了两天才安装好,现在分享一下我的经验,希望大家能不要再踩坑了,基本把能踩的坑踩完了,按照接下来的教程一步一步去做就没问题。我这里是在anaconda里安装的,使用的是jupyternotebook文章目录目录文章目录一.安装教程1.安装2.给jupyternotebook更换内核1.没有安装C++编译器解决办法2.没有plotly库解决方法3.在jupyternotebook在使用pip insta.

2022-04-30 22:08:59 4045 7

原创 AMIRA时间预测实现过程详解(含代码可直接套用)

ARIMA思维导图和解决全过程方法基本思路就是这样,接下来带你一步步实现白噪声检验白噪声序列各项之间没有任何的关系,完全为无序波动,没有任何信息可提供即终止分析。代码from statsmodels.stats.diagnostic import acorr_ljungboxprint("白噪声检验结果为:",acorr_ljungbox(data,lags=1))#这里得到两个值,第一个是统计量第二个是p值,一般来说p小于0.05就可以判定

2022-04-08 17:11:34 1430 2

原创 快速上手matplotlib(可直接套用)

最近的task 经常需要用到matplotlib来作图,希望能找到能够立马拿来套用的模板,但是翻了很多的博客没有自己想要的类型,于是想要自己整理一份笔记和大家一起分享,如果觉得有用的话可以点赞收藏关注,以后还会出类似的系列。#导入包import matplotlib.pyplot as pltimport numpy as npimport pandas as pdplt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签plt.rc

2022-04-06 20:08:08 468

原创 关于时间序列用resample重采样问题

在处理时间序列的时候我们往往需要用到重采样的,首先我们先要明确重采样是什么的:重采样字面理解就是对我们的样本进行重新采样的方法那么重采样是用来做什么的呢例如:数据给出了每一分钟得到的相关数据,而我们需要统计每小时的数据总和或者平均值这时我们就是需要用到重采样的下面是实现方法:1.数据处理将时间序列变成索引df=df.set_index("time",append)2.重采样df_new=df.resample("M").mean()#对分钟进行重采样得到每小时的均值.

2022-04-05 23:00:22 925

原创 如何将字符串str转为float数组

如何将字符串str转为float数组

2022-03-30 17:41:54 5106

原创 测试集出现新类别时OnehotEncoder报错解决

今天在学习机器学习时候发现了error一直提示我无法transform首先我们要明确测试集的新类别的占比应该是比较小的,如果占比很大可能模型的效果会比较差也可能是在分割测试集和训练集的时候没有做好解决这个问题有两种方法 1.第一种是将测试集和训练集合并这样来进行独热编码这样可以保证所有的类别都出现在里面如果还不行的话 2.可以试试第二种OneHotEncoder(handle_unknown = "ignore")忽略未知的值这样也能够正常运行...

2022-03-22 20:18:00 1183 1

原创 当series用math包里的log计算出现错误

series用math取对数出现问题

2022-03-22 17:02:24 1149

原创 为什么linspace是包含而arange是不包含最后的数

linspace和arange

2021-12-20 12:25:50 760

原创 如何简单理解numpy中的transpose转置和swapaxes

刚开始学习numpy理解transpose确实是一个小难点但其非常简单!只要我们搞清楚最基本的数据形状就很好理解了import numpy as nparr=np.arange(16).reshape((2,2,4))print(arr)

2021-10-27 09:07:17 166

原创 简易理解版)将python中列表数据导出为excel

欢迎来到爱踢球的猕猴桃的造厕之旅相信你也有这样的烦恼 厕所难找这事儿其实很简单,自己造厕 安装excel模块 既然是上厕所,那就一定要有人对吧打开命令终止符 命令你的电脑下载xlwt xlrd(这俩一个写,一个读,就像女生上厕所一定要结伴出行)pip install xlwtpip install xlrd下载完成,引入这一对闺蜜import xlwt (我自己import xlrd (闺蜜现在开始游戏 创建一个工作簿 啊这个你们都懂,首先...

2021-10-21 23:48:29 3797 2

原创 如何将excel文件转换成csv文件并读取

将excel文件转换为csv文件其实很简单 直接在另存为这里设置保存为csv格式就好了 如何读取csv文件 csv文件就是将数据作为一系列以逗号分隔的值写入文件读取csv文件那就要先引入csvimport csv然后再选择你要读取的文件名filename=(‘(文件夹)‘/(文件名).csv) #这里要注意 文件夹要与该程序在同一个大的文件夹下,而我们需要的文件要和在该文件夹里现在开始准备读取啦!读取文件那肯定要先打开文件with o...

2021-10-21 22:09:03 7479

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除