小小白鹿-CSDN博客

原创自学笔记|优美画出python局部放大图

【代码】自学笔记|优美画出python局部放大图。

2023-07-20 15:17:04 1090

原创 RuntimeError: mat1 and mat2 shapes cannot be multiplied (2x128 and 64x1)

我在添加,bidirectional=True给self.gru = nn.GRU(hidden_size, hidden_size, num_layers, batch_first=True)后。双向GRU会使用两个单独的GRU模型，一个用于处理正向序列，另一个用于处理反向序列。这两个模型的输出会被拼接在一起作为最终的输出。层的输入形状，使其能够接收双向GRU的输出。是因为双向GRU的输出包含了正向和反向两个方向的隐藏状态。所以，当你尝试将双向GRU的输出传递给。然而，在你的代码中，self.fc。

2023-07-19 22:54:00 891

原创在使用GRU预测时，时间不连续会有影响吗

此外，如果时间不连续性很大，并且不能通过简单的插值处理来修复，可能需要考虑其他建模方法，如卷积神经网络（CNN）或Transformer等，这些模型对于时间不连续性相对较大的序列数据可能更加适用。如果时间不连续性较小，可以尝试将时间戳调整为较小的单位，例如分钟级别或小时级别，以更好地捕捉时间依赖关系。另外，还可以将缺失的时间段进行插值处理，填充缺失值，以保持相对较连续的时间序列。因为GRU假设序列数据的时间间隔是均匀的，并且下一个时间步骤的输入依赖于前一个时间步骤的输出。

2023-07-13 12:57:40 364 1

原创自学笔记|python画图小笔记

【代码】自学笔记|python画图小笔记。

2023-07-01 15:59:10 215

原创自学笔记|已知年月日数据，要求年月数据

这样我们就得到了一个新的df，包含有我们月平均值的数据。

2023-07-01 15:11:33 184

原创自学笔记|筛选dataframe行数据并保存

转换为字符串类型，并检查每个元素是否包含字符串 "CHN" 或 "USA"。最终返回一个具有相同形状的布尔值DataFrame，其中每个元素为 True 或 False 表示对应位置上的元素是否满足条件。：这一部分使用布尔索引，将符合条件的行筛选出来。转换为字符串类型，并检查每个元素是否同时包含字符串 "CHN" 和 "USA"。然后，使用按位与操作符。中所有对应位置为 True 的行。只有满足条件的行会被选中，其他行将被排除。），判断每一行中是否存在任何一个元素满足条件。方法，沿着每一行的方向（

2023-07-01 13:10:06 605

原创在统计量异常值检测遇到的问题

样本X和主成分矩阵P_k之间的投影是非常接近的，其模长差异非常小。这意味着样本X的结构与主成分矩阵P_k的结构非常相似，可以视为是P_k所能表示的样本集合中的一个实例。||X'P_k||^2项将为0，因此Q_count简化为Q = ||X||^2。这时，Q_count的值只取决于样本X本身，而与主成分矩阵P_k无关。np.dot(np.dot(test_data_nor.T, (I - np.dot(p_k, p_k.T))), test_data_nor)改为。在Q-PCA计算Q值的时候，Q值为0.

2023-06-16 20:49:27 138

原创 ValueWarning: Dynamic prediction specified to begin during out-of-sample forecasting period, and so

警告提醒您进行了一个在样本外预测时指定起始时间的“动态预测”。但由于这在样本外预测阶段已经确定了初始值和参数，所以此动态预测并没有产生任何效果。因此，该警告可以被忽略。如果您确实想要进行动态预测，则需要在样本内预测阶段指定一个较早的时间开始动态预测，以获得更好的预测结果。总之，这个警告并不是一个错误，它只是告诉您您的某些设置可能无效。如果您不关心动态预测，可以安全地忽略它。这是一个警告而不是错误，它通常是由于时间序列模型进行动态预测时的设置问题导致的。

2023-04-19 09:27:59 276

原创 KeyError: ‘The `end` argument could not be matched to a location related to the index of the data.‘

指的是这个错误是由于内存不足，导致无法为形状为(27, 3455773)和数据类型为float64的数组分配712MB的内存。减小数组大小：您可以考虑减少数组的大小或使用更小的数据类型。使用分块方法：您可以使用分块方法来处理大型数组而不需要将整个数组加载到内存中。使用分布式计算：如果您有多台计算机，则可以将计算任务分配给多台计算机并使用分布式计算。：创造完整的时间序列索引，使用插值法填充缺失值，使时间间隔规律化并且没有缺失值。增加系统内存：如果您的系统内存较小，则可以添加更多内存，以便可以分配所需的内存。

2023-04-17 23:11:22 1495

原创创建新的时间序列并把原始时间序列的值填入新的时间序列当中

把时间作为索引，然后创造完整的以秒为频率的时间序列。首先是原始的dataframe。

2023-04-17 17:09:42 179

原创 AttributeError: ‘pandas._libs.properties.CachedProperty‘ object has no attribute ‘func‘

该错误提示表明在执行ARIMA模型的拟合过程时出现了问题，其中涉及到Statsmodels库中的一个函数属性缺失。之前的版本是statsmodels 0.12.2。更新statsmodels-0.13.5。是可以跑程序的，说明是order参数的p值“不能用”。win+r打开控制窗输入cmd，再输入下面这段代码。

2023-04-06 12:42:18 669

原创 ValueError: could not convert string to float: ‘-2914.013108.005‘

处理该错误的方法是先将字符串中的非数字字符去除或替换为合法字符，再进行浮点数转换。函数和正则表达式来实现这一步骤。txt文档里面有一列数据计数发生错误。会报出正确的结果，即。

2023-03-27 17:16:44 2362 1

原创自学笔记|为什么使用df.info()，查看某一列类型，那一列是数字，但是显示是object类

在这种情况下，需要将该列中的非数字型数据或者缺失值进行处理或替换后，再将该列数据类型转换为数字型（例如int、float）。因为我用decribe查看数据信息的时候，object会产生unique的结果，我想要的是最大值最小值标准差的结果。2.该列中存储的确实是数值型数据，但是读入数据时没有成功地解析出数据类型。这种情况下，通常可以使用函数。1.该列包含了非数字型的数据或者缺失值（例如NaN），导致该列类型被自动解析为了。对该列进行强制类型转换，以将该列数据类型转换为数字型。

2023-03-27 16:21:06 962

原创自学笔记|遍历循环读取文件夹所有txt，并以dataframe形式储存

问题：我的文件夹里有6000个txt，读到一半的时候速度很慢（后面还会越来越慢）解决办法：使用列表推导式将所有读取的DataFrame对象存放在列表中，最后通过。后记：这两个程序都能用，我觉得数据量小的情况下第一种更好理解一点。函数一次性将它们合并为一个DataFrame对象。，导致内存消耗和操作时间不断增加。原因：在每次循环中都。

2023-03-26 22:40:52 719

原创 ValueError: This sheet is too large! Your sheet size is: 7566760, 19 Max sheet size is: 1048576, 163

写入是成功写入了，就是文件太大打不开，问题不大，能作为“中间”文件保存下来就行，之后要用这个dataframe直接。首先，它们都是是pandas库中用于将DataFrame保存至文件的方法。可以将DataFrame保存至Excel文件，而。解决方法：不要写入excel，写到txt文档。则可以将DataFrame保存至CSV文件。问题描述：行数太多，excel写入不了。df.to_excel()和。用pd.read_csv()

2023-03-26 20:38:40 1902

原创 pandas.errors.ParserError: Error tokenizing data. C error: Expected 10 fields in line 244, saw 11

这个错误通常在读取CSV文件时出现，它表明在解析CSV文件的某一行时出现问题。具体而言，该错误表示在第244行中，Pandas期望在该行中看到10个字段，但实际上读取的是11个字段，这导致了解析错误。使用该库，你可以直接打开 CSV 文件，并将其转化为可遍历的 CSV 行对象，然后逐行处理数据。参数可以控制当遇到数据行字段数量不匹配等异常情况时的处理方式，若是遇到该错误将跳过不合格的行继续读取原始数据，而不是抛出异常并终止程序运行。我打开txt文档看了一下，问题是计数错误，出现错误的那一行多了数据。

2023-03-26 13:58:22 3191 1

原创自学笔记|使用pd.read_csv以dataframe格式读取txt

结果如下：{'encoding': 'GB2312', 'confidence': 0.99, 'language': 'Chinese'}所以这里的encoding参数设为GB2312就行了（gb大小写应该都行没试）。可能遇到的问题：注意txt文档编码格式，不然用pd.read_csv可能会报错。pd.read_csv的header参数用于控制哪一行作为列名。可以看到encoding编码格式是“GB2312”，这是中文编码的意思。pd.read_csv的skiprows参数表示要跳过的行数。

2023-03-25 22:50:56 1683

原创 pycharm 中it chat模块安装失败

问题：想通过pycharm>file>settings>Python Interpreter>package 安装itchat包，发现找不到有这个包。解决方法：cmd>pip install itchat 直接装，10秒安装完成。起因：突发奇想，想通过python实现自动回复微信消息。

2023-03-21 16:22:34 706 2

m0_48196258的博客