py
文章平均质量分 73
xifenglie123321
联系邮箱qingchengaiai@126.com
展开
-
Python编程:python-attrs模块的简单使用
attrs 可以简单理解为namedtuple的增强版。原创 2024-04-03 15:33:49 · 314 阅读 · 0 评论 -
Oracle 递归函数
假设我的输入日期是01012016 ,函数应该递归执行直到31122016 (每月最后一天,即总共12次)我应该从这个光标将数据插入到一个文件中。这个文件应该为作为输入传入的日期单独生成。但你的问题不一定意味着递归,在我看来,你只是想在循环中处理一些东西。使用此i_date ,它应该执行类似于将数据从表读取到游标的操作。你能给我一个在plsql中递归函数的例子吗。递归函数只是一个调用自己的函数。它将i_date作为输入变量。原创 2024-04-03 15:33:05 · 222 阅读 · 0 评论 -
递归函数解析
使用递归函数需要注意递归深度溢出,在Python中,通常情况下,这个深度是1000层,超过将抛出异常。在计算机中,函数递归调用是通过栈(stack)这种数据结构实现的,每当进入一个递归时,栈就会加一层,每当函数返回一层,栈就会减一层。由于栈的大小不是无限的,所以递归调用的次数过多,会导致栈溢出。初始化算法,递归程序通常需要一个开始时使用的种子值,可以向函数传递参数,或者提供一个入口函数,这个函数是非递归的,但可以为递归计算设置种子值;当n小于0的时候,直接给出和值为0,当n大于0时,结果是n加上。原创 2024-04-03 15:32:10 · 147 阅读 · 0 评论 -
关于递归的一些想法
学习递归有以下几个重要原因:1. 简化问题求解:通过将大问题分解为与之相似但规模较小的子问题,可以更简洁地解决复杂问题。2. 具有简洁性和直观性:递归的代码结构通常相对简单,易于理解。3. 解决特定问题:某些问题,如树的遍历、回溯等,递归是一种自然且有效的解决方式。4. 算法设计:在一些算法中,递归可以提供清晰的思路和实现方式。5. 培养编程思维:帮助程序员更好地理解问题的本质和解决问题的方法。6. 代码可读性:递归代码通常具有较高的可读性,因为它清晰地展示了问题的分解过程。原创 2024-03-29 20:43:42 · 179 阅读 · 0 评论 -
从聚类分析看AI
聚类分析是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好。主要介绍的是K-Means和bisecting K-means算法以及凝聚层次聚类算法。K均值算法:优点:容易理解,聚类效果不错,算法复杂度低。缺点:K值需要人为设定,不同K值得到的结果不一样;为了克服K-Means算法收敛于局部最小值的问题,提出了一种二分K-均值。凝聚层次聚类算法又叫自下而上算法。层次聚类算法的实现。原创 2024-03-27 15:50:03 · 150 阅读 · 0 评论 -
聚类分析以及k-means的优缺点
于是根据一批样本的多个观测值指标,具体找出可以度量样本之间相似的统计量,以这些统计量作为划分类型的依据,把一些相似程度较大的样本聚合为一类,把另外一些彼此之间相似程度较大的样本又聚为一类,关系密切的聚合完毕,把不同类型的一一划分起来形成小到大的分类系统。(1)基本思想:确定了距离和相似系数后就要进行分类,有多种分类方法,最常用是样品自成一类,然后把每次具有最小距离的两类进行合并,合并后继续计算类与类之间的距离,这个过程是一直持续到把所有样本归为一类,并把这个过程作成一张聚类图,由聚类图进行方便的分类。原创 2024-03-27 15:48:43 · 1324 阅读 · 0 评论 -
Postgis实现聚类分析
- 该函数是窗口函数,主要是用K-means(K均值聚类)算法进行聚类,算法原理比较简单,容易实现,主要适用于点样本数据,如果是多边形则用多边形的中心点计算,只有一个参数K簇,就是事先明确了要把这一堆样本数据聚成K个类,然后去计算一个目标函数达到最优解,因此K值对结果影响比较大,不太好选取,而且该算法而且适合凸的数据集,这也算法容易收敛;都是根据要素的自身属性,可能是空间的或者非空间的,利用数学方法按照某种相似性或差异性的指标,定量的确定各个要素之间的亲疏关系,然后按照这种亲疏关系的程度对要素进行聚类。原创 2024-03-27 15:47:10 · 672 阅读 · 0 评论 -
npm、webpack讲解
淘宝镜像是一个提供国内高速下载的镜像资源,并且每10分钟,就和官方同步一次数据。平时下载包的时候可以使用淘宝镜像,但是想要发布包就必须是使用官方的源。原创 2024-03-25 15:42:29 · 451 阅读 · 0 评论 -
MySQL的redo日志
InnoDB以页为单位管理存储空间,而真正访问页面之前,需要把在磁盘上的页缓存到内存中的Buffer Pool之后才可以访问,但是对于一个已经提交的事务,假如我们只在内存的Buffer Pool中修改了页面,假设在事务提交后突然发生了某个故障,导致内存中的数据丢失,这个提交的事务对数据库中的修改也丢失了,这是不能忍受的,也就不满足数据库持久性的要求。原创 2024-03-25 15:40:54 · 723 阅读 · 0 评论 -
使用Python和OpenPlayground轻松探索大语言模型
大语言模型或LLM是一个能够理解、解释和生成人类文本的模型。通过使用OpenPlayground,可以有一个简单的UI来探索和实验多个LLM。原创 2024-03-25 15:39:37 · 438 阅读 · 0 评论 -
什么是数据结构?什么是算法?
生活中关于“结构”我们经常见到,如:一棵大树可分为树干、枝丫和树根,河流、马路的结构同理也可这样划分;数据:客观事物的符号表示,是所有能输入到计算机中并能被计算机程序处理的符号的总称。3、多媒体程序处理的图形、图像、声音及动画等通过特殊编码定义后的数据。打比赛,比如最近华为公司的2019华为软件精英挑战赛,面对这样的大型比赛,数据结构和算法是参赛选手的重量级武器。接着是算法,算法定义:一个有穷的指令集,这些指令为解决某一特定任务规定了一个运算序列.算法的描述方式可以是自然语言、流程图、程序设计语言、伪码。原创 2024-03-25 15:38:29 · 189 阅读 · 0 评论 -
什么是机器学习
机器学习是挃是一门多领域交叉学科。专门研究计算机或其它软硬件设备怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。应用机器学习技术到产品中,给用户带来“机器具备人类般高智能”的震撼性体验。人力成本又越来越高,机器学习能降低企业成本,提高投入产出比。第二次机器革命——以具备人类智能为核心价值的机器占主导地位(第一次机器革命——动力系统革命),对国家软实力具有重要作用。机器学习是人工智能研究的核心内容。原创 2024-03-25 15:37:00 · 558 阅读 · 0 评论 -
金融时间序列预测方法合集:CNN、LSTM、随机森林、ARMA预测股票价格(适用于时序问题)、相似度计算、各类评判指标绘图
open 开盘价;close 收盘价;high 最高价low 最低价;volume 交易量;label 涨/跌。原创 2024-03-25 15:34:56 · 2242 阅读 · 0 评论 -
数学建模竞赛准备之python环境篇
最近正在准备国赛,之前试过在电脑上安装 tensorflow,但一直都不成功。然后看了一眼 pip 管理工具下一堆包,乱得一批,所以干脆直接打算捡一些比较重点的包装上,比较鸡肋的就不要了。因为我这里用的是 Mac 系统的,和 windows 的语句可能不一定相同,但如果是用 Linux 应该没问题(因为 Mac 系统终端里的命令大多数和 Linux 一样)numpy数据分析类,相当于 免费版的Matlab 矩阵功能以及其它一些少量的小算法。pandas数据分析类,非常完美的表格操作,非常适合洗数据。原创 2024-03-25 15:34:02 · 541 阅读 · 0 评论 -
时间序列分析|一些简单的概念
日常生活和工作中经常会遇到跟时间有关的现象,需要对其进行分析和研究,比如早晨上课前半小时食堂吃早餐剩余人数的变化情况,某小区一年内房源成交套数的变化情况以及太阳黑子数十年内的变化情况等都属于时间序列的范畴,前面三个例子代表了两类典型的时间序列形成机制,一类是因人类社会活动而产生的时间序列,一类是因自然界某种力量产生的时间序列,两者都遵循各自内自然逻辑,做时间序列分析有一个默认的公理——原创 2024-03-24 18:43:34 · 722 阅读 · 0 评论 -
使用LSTMs和Prophet进行时间序列预测你的电子邮箱负载(附代码)
然后,模型输出的是重要邮件的数量,而不是实际收到的电子邮件数量。在这里,我们将尝试一些与每个用户更相关的东西,即你将收到的电子邮件的数量。这里的目标是如何为不同的算法准备数据,并提供定性的概述,而不是精细化。从数据中我们可以看到一个明显的规律,即分发遵循一个典型模式,从星期一至星期五早9-晚5的时间表,其中上午10点收到的邮件最多。最后别忘了,我们的基线模型的表现就很不错,所以你不一定总是需要复杂的机器学习算法来搭建你的预测模型。这类问题的一个关键挑战是,如果只有零星的偶发事件,那么内在趋势是不可预测的。原创 2024-03-24 18:42:51 · 738 阅读 · 0 评论 -
基于RNN/LSTM/GRU的情感预测实战
我们不会将所有的东西都全部丢弃,然后用空白的大脑进行思考。print(tf.reduce_min(y_train),tf.reduce_max(y_train),#min-0差评Neg,max-1好评Pos。print(tf.reduce_min(y_train),tf.reduce_max(y_train),#min-0差评Neg,max-1好评Pos。print(tf.reduce_min(y_train),tf.reduce_max(y_train),#min-0差评Neg,max-1好评Pos。原创 2024-03-24 18:41:41 · 751 阅读 · 1 评论 -
Python--NumPy库
np.loadtxt(frame, dtype=np.float, delimiter = None, unpack = False) : frame是文件、字符串等,可以是.gz .bz2的压缩文件;np.savetxt(frame, array, fmt=’% .18e’, delimiter = None): frame是文件、字符串等,可以是.gz .bz2的压缩文件;np.log(a) np.log10(a) np.log2(a) : 计算各元素的自然对数、10、2为底的对数。原创 2024-03-24 18:39:53 · 822 阅读 · 0 评论 -
泊松回归统计模型
计数数据不能连续取值,或只能得到0,1,2,3等自然数的数据。广义线性模型(GLM)是线性模型的扩展,通过联结函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。其特点是不强行改变数据的自然度量,数据可以具有非线性和非恒定方差结构。极大似然估计不能通过解析表达式获得解析解,由其对数似然函数为凸函数的特性,可通过Newton–Raphson或其他基于梯度下降的方法进行计算。其中表示形式为计数数据的响应变量,表示由一组相互独立的解释变量变量组成的向量,表示待估参数,可根据极大似然估计法进行估计。原创 2024-03-22 08:14:05 · 1593 阅读 · 0 评论 -
基于Tensorflow库的RNN模型预测实战
Tensorflow是使用较为广泛的一个深度学习框架,通常运用在图像识别、图片分类等领域,它是一个采用数据流图,用于数值计算的开源软件库。从命名来理解的话:Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算。在TensorFlow中,数据不是以整数、浮点数或者字符串形式存在的,而是被封装在一个叫做Tensor的对象中。Tensor是张量的意思,张量包含了0到任意维度的量,其中,0维叫做常数,一维叫做向量,二维叫做矩阵,多维度的直接叫做张量。原创 2024-03-22 08:11:03 · 1426 阅读 · 0 评论 -
AI工具集大合集17个类别
现代办公室的新宠——Office类AI工具,它们以自动化的形式出现在您的工作流程中,无需花费大量时间,即可打造出专业级的演示文稿和报表。简化流程,提高质量,一切尽在掌握。- 入口:https://www.feishu.cn/product/minutes?- 入口:https://meeting.tencent.com/ai/index.html。- 入口:https://hunyuan.tencent.com/bot/chat。- 入口:https://www.baichuan-ai.com/chat。原创 2024-03-22 08:10:02 · 1222 阅读 · 0 评论 -
一文详解 ROC/AUC
AUC(area under the curve)是机器学习领域中一种常见且重要的模型评估标注,表示ROC(receiver operator characteristic)曲线下的面积。今天我们就和大家一起来梳理一下有关ROC/AUC的基本知识。在正式介绍ROC/AUC之前,我们还要再了解几个指标。原创 2024-03-22 08:00:36 · 1944 阅读 · 0 评论 -
DLNM(分布滞后非线性模型)
最近一段时间在做流行病数据的分析,期间学习DLNM模型的过程中碰到了挺多问题百度搜不到,笔者通过慢慢读原文献、看代码解决了一部分,当然还是有一些没太搞懂hhh。本文使用数据集进行建模分析演示,该数据集包含1987-2000年芝加哥每日的死亡率、天气(温度、露点温度、相对湿度)和污染(PM10和臭氧)等情况。year: Yearpm10: PM10o3: Ozone很早之前就想写一篇 DLNM 的推文了,但是由于事情比较多一直也没来得及写。原创 2024-03-22 07:59:58 · 3961 阅读 · 6 评论 -
“数学建模”到底是什么
所谓数学模型 (Mathematical Model)是一种模拟,是用数学符号、数学式子、程序、图形等对实际课题本质属性的抽象而又简洁的刻画,它或能解释某些客观现象,或能预测未来的发展规律,或能为控制某一现象的发展提供某种意义下的最优策略或较好策略。当需要从定量的角度分析和研究一个实际问题时,人们就要在深入调查研究、了解对象信息、作出简化假设、分析内在规律等工作的基础上,用数学的符号和语言作表述来建立。数学建模的思想可以帮助我们解决生活中的许多问题,也是许多工作岗位所要求的技能,值得我们的深入学习。原创 2024-03-22 07:58:55 · 481 阅读 · 0 评论 -
超参数调优之网格搜索
超参数是在训练模型之前就要设置的参数,而不是通过训练得到的参数。举个例子来说,神经网络的隐层数和每层的节点数就是超参数,因为其需要在模型训练前就设定好。而两层神经元之间的权重就不是超参数,因为其随着每一轮迭代而不断更新。网格搜索是一种常见的参数调优方法,其根本目的是通过遍历不同的超参数组合,达到模型最优化的效果。原创 2024-03-22 07:58:05 · 1359 阅读 · 0 评论 -
LSTM的输入输出是怎样的?
要注意的是,这个RNN模型中只有一个A,不同的时间戳下对应的A的参数是一样的,只是不同时间戳下A的输入和输出可能不同。在MLP的介绍中我们已经指出MLP的叠加是完全连接的,但是RNN的叠加是相同时间戳对应单元的叠加,所以我们看到A1出来的h0只进入了A2第一个时间戳单元,并没有进入后面的单元。看完上面的介绍,也许你会觉得ht,比如h0就是一个数值,但是这并不是必须的,比如在tensorflow中ht可以是一个向量,我们可以指定ht的长度。如果理解了RNN的结构,那对LSTM的理解是几乎一样的。原创 2024-03-20 14:40:59 · 1065 阅读 · 0 评论 -
lstm整理
如果有明确的训练数据,那么极端情况下这样的模型可以把整个训练数据的特征都学习完毕,但问题在于这也仅仅是在语法层面实现了语言的学习,并没有深入到知识层面。按照RNN的经验,其实如果是简单序列,模型的容错性是比较高的,但过程中发现lstm的容错性更高,主要原因就是遗忘门的引入。另外之前在RNN的时候看到有人说做clip会对结果有很好的提升,实际发现如果用了clip以后,loss下降相对是比较稳定的,如果不用clip,loss下降会有较大的波动,这也和论文所说的一致。原创 2024-03-20 14:40:14 · 443 阅读 · 0 评论 -
基于长短期记忆神经网络(Lstm)的道琼斯指数预测
32),第四层为dropout层(dropout=0.054,用于防止过拟合),第四层为全连接层(神经元个数为5,用于预测未来5道琼斯指数),估计参数使用Adam优化器,学习率采用LR衰减方式,并将最大迭代次数设置为70次,可得训练集、验证集loss变换趋势如下。笔者对1980年12月23日至2020年2月7日共9866个交易日的道琼斯指数进行缺失值检验,发现并无缺失值,然后将输入窗口设置为50、输出窗口设置为5( 即利用前50天的道琼斯指数预测后5天的道琼斯指数),对数据进行切片。原创 2024-03-20 14:38:19 · 985 阅读 · 0 评论 -
python文件批量改名
python文件批量改名原创 2022-06-30 14:32:21 · 167 阅读 · 0 评论