自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(311)
  • 资源 (25)
  • 收藏
  • 关注

原创 语音深度鉴伪识别项目实战:基于深度学习的语音深度鉴伪识别算法模型(三)音频去噪算法大全+Python源码应用

深度学习技术在当今技术市场上面尚有余力和开发空间的,主流落地领域主要有:视觉,听觉,AIGC这三大板块。目前视觉板块的框架和主流技术在我上一篇基于Yolov7-LPRNet的动态车牌目标识别算法模型已有较为详细的解说。与AIGC相关联的,其实语音模块在近来市场上面活跃空间很大。从智能手机的语音助手到智能家居中的语音控制系统,再到银行和电信行业的语音身份验证,语音技术的应用日益广泛。

2024-06-06 11:20:18 1300 36

原创 语音深度鉴伪识别项目实战:基于深度学习的语音深度鉴伪识别算法模型(二)音频数据预处理及去噪算法+Python源码应用

Fanstuck博主现任高级人工智能工程师,专注于深度学习项目的实际应用。曾发表多篇SCI论文并在多次国际竞赛中获奖,具备深厚的理论知识和丰富的实战经验。专栏内容涵盖图像处理、预测分析、语音识别等深度学习项目,每篇文章均包含详细的实战项目与可运行代码。目标是帮助零基础读者快速掌握各类深度学习模型及其应用,提供最新的竞赛思路和全面的解决方案。紧跟技术前沿,为读者呈现最具实用价值的内容。深度学习技术在当今技术市场上面尚有余力和开发空间的,主流落地领域主要有:视觉,听觉,AIGC这三大板块。

2024-05-31 16:56:50 1636 22

原创 语音深度鉴伪识别项目实战:基于深度学习的语音深度鉴伪识别算法模型(一)音频数据编码与预处理

深度学习技术在当今技术市场上面尚有余力和开发空间的,主流落地领域主要有:视觉,听觉,AIGC这三大板块。目前视觉板块的框架和主流技术在我上一篇基于Yolov7-LPRNet的动态车牌目标识别算法模型已有较为详细的解说。与AIGC相关联的,其实语音模块在近来市场上面活跃空间很大。从智能手机的语音助手到智能家居中的语音控制系统,再到银行和电信行业的语音身份验证,语音技术的应用日益广泛。

2024-05-27 17:36:11 1552 35

原创 2022 年高教社杯全国大学生数学建模竞赛-C 题 古代玻璃制品的成分分析与鉴别详解+聚类模型Python代码源码

简单介绍一下我自己:博主专注建模四年,参与过大大小小数十来次数学建模,理解各类模型原理以及每种模型的建模流程和各类题目分析方法。参与过十余次数学建模大赛,三次美赛获得过二次M奖一次H奖,国赛二等奖。**提供免费的思路和部分源码,以后的数模比赛只要我还有时间肯定会第一时间写出免费开源思路。**博主紧跟各类数模比赛,每场数模竞赛博主都会将最新的思路和代码写进此专栏以及详细思路和完全代码且完全免费。希望有需求的小伙伴不要错过笔者精心打造的文章。

2024-05-15 17:35:19 1149 13

原创 Prompt提示工程上手指南:基础原理及实践-思维树 (ToT)策略下的Prompt

此篇文章已经是本系列的第五篇文章,之前我们已经将检索增强生成(RAG)策略,逐渐我们掌握的知识和技术都在不断提高,对于Prompt的技巧策略也不能只局限于局部运用而要适应LLM大模型的整体框架去进行改进休整。较为主流的LLM模型框架设计基于链式思考(CoT)、思维树 (ToT)和检索增强生成 (RAG)这三大框架我们现在要开始了解学习思维树 (ToT)。如何建立一个[解决通用问题的语言模型]?如何能够让LLM能够深思熟虑的解决问题?我们人类通过搜索一个组合式问题空间来解决问题。

2024-04-16 14:33:36 1814 17

原创 腾讯EdgeOne产品测评体验—Web服务全能一体化服务,主打一步到位

自己感觉难受不说,网站稍微有点要出头的时候,数不清的访问攻击就接踵而至:恶意软件、SQL注入、网站挟持、钓鱼攻击、跨站脚本攻击、恶意爬虫等等,让个人开发者甚为揪心,如果是企业网站的话,攻势有过之无不及。同时,与当前市面上的安全产品多采取(保底+弹性)的计费方式:流量包含业务流量+攻击流量不同,EO的流量计费均为干净流量(即经防护过的流量)是正常的业务流量,不会产生非预期账单,方便企业进行预算管理,对企业业务发展更友好。通过对异常/攻击事件进行抓包分析,提取攻击源和攻击报文,可以作为攻击溯源的重要依据。

2024-04-16 09:34:22 4121 9

原创 2022 年高教社杯全国大学生数学建模竞赛-C 题 古代玻璃制品的成分分析与鉴别详解+Python代码源码

简单介绍一下我自己:博主专注建模四年,参与过大大小小数十来次数学建模,理解各类模型原理以及每种模型的建模流程和各类题目分析方法。参与过十余次数学建模大赛,三次美赛获得过二次M奖一次H奖,国赛二等奖。**提供免费的思路和部分源码,以后的数模比赛只要我还有时间肯定会第一时间写出免费开源思路。**博主紧跟各类数模比赛,每场数模竞赛博主都会将最新的思路和代码写进此专栏以及详细思路和完全代码且完全免费。希望有需求的小伙伴不要错过笔者精心打造的文章。

2024-04-11 16:52:04 1350 35

原创 Prompt提示工程上手指南:基础原理及实践(五)-思维树 (ToT)策略下的Prompt

此篇文章已经是本系列的第五篇文章,之前我们已经将检索增强生成(RAG)策略,逐渐我们掌握的知识和技术都在不断提高,对于Prompt的技巧策略也不能只局限于局部运用而要适应LLM大模型的整体框架去进行改进休整。较为主流的LLM模型框架设计基于链式思考(CoT)、思维树 (ToT)和检索增强生成 (RAG)这三大框架我们现在要开始了解学习思维树 (ToT)。如何建立一个[解决通用问题的语言模型]?如何能够让LLM能够深思熟虑的解决问题?我们人类通过搜索一个组合式问题空间来解决问题。

2024-04-09 11:34:24 1364 40

原创 如何一键展示全平台信息?Python手把手教你搭建自己的自媒体展示平台

灵感源于之前写过的Github中Readme.md中可以插入自己的js图片和动态api解析模块,在展示方面十分的美观:具体来说,你可以使用标签来嵌入图像,并使用src属性指定图像的URL。我们可以通过访问这个API端点,可以获取到一张包含指定GitHub用户统计信息的图像,然后可以在GitHub的README文件中使用这个图像来展示用户的GitHub统计信息。那么如果我们想要像大家展示我们其他媒体的数据,只需要开发出每个平台的相应的展示接口就可以集成到一个markdown文件展示了。

2024-04-02 14:32:13 1465 31

原创 Prompt提示工程上手指南:基础原理及实践(四)-检索增强生成(RAG)策略下的Prompt

想象一下,当你在写一篇文章或解决一个问题时,如果遇到了难题,你会怎么做?可能会去搜索引擎查找信息,然后基于找到的信息来构建你的答案。这个过程,其实很像是RAG框架在做的事情。化繁为简,我们先来了解RAG到底是什么。先从字母意思开始理解,RAG——Retrieval Augmented Generation,正如其名,是一种将检索(Retrieval)和生成(Generation)结合起来的技术。它首先从一个巨大的知识库中检索出与提出的问题最相关的信息,然后基于这些信息来生成回答。

2024-03-25 10:22:46 2896 17

原创 实地研究降本增效的杀伤力,LSTM算法实现全国失业率分析预测

下面我会概述这个过程的每个步骤,并提供相应的示例代码。我们将会从数据获取–数据处理–LSTM建模–预测检测这四个流程依次进行最终得到一个较为合理准确的数据,当然该预测率的准确度是依赖获取到的官方数据的,至于数据真实性这个不作过多解释~大家只要了解建模过程如何和LSTM模型如何使用就好。且每篇文章我都会尽可能将简化涉及到垂直领域的专业知识,转化为大众小白可以读懂易于理解的知识,将繁杂的程序创建步骤逐个拆解,以逐步递进的方式由难转易逐渐掌握并实践,欢迎各位学习者关注博主,博主将不断创作技术实用前沿文章。

2024-03-19 10:24:13 2424 29

原创 Prompt提示工程上手指南:基础原理及实践(三)-Prompt个性知识库引导

Prompt系列的第二期文章已经将所有的Prompt工程主流策略讲解完毕,共涉及到六种Prompt类别模型以及具体生产内容详解。再结合系列第一篇文章具体对Prompt工程的详细介绍,也就可以达到Prompt工程师的初步入门,现在如果掌握了这些基础技能那么就可以去学习一些更高阶的Prompt技能,伴随GPT-4 Turbo达到可生成自定义的GPTs,能够搭建属于业务目标的知识。

2024-03-18 10:47:00 1705 21

原创 vue项目打包解决Vue Router加载无效(404)报错 No such file or directory

在写Vue3项目的时候,使用了Vue Router前端路由,配置为history模式。进行项目打包上传到服务器的时候,正常测试访问页面,当刷新当前路由的时候,就会出现404的状况,检查日志发现全是No such file or directory目标路径的问题。

2024-03-15 16:57:09 1245 5

原创 Prompt提示工程上手指南:基础原理及实践(二)-Prompt主流策略

在上篇文章中我们了解到Prompt基本种类有以下几种:如果大家经常用语言大模型的一些原生应用或者是去看过一些Prompt模板,开头的第一句往往都是说:我想让你担任xxx或者是你是一名xxx诸如此类定义人设的话:诸如此类的Prompt模板,为方便其中指定人设这段话我称之为System message,System message包含着Prompt开头,用于为模型提供上下文、指令或与使用案例相关的其他信息。

2024-03-14 09:19:59 1526 35

原创 (源码版)2024美国大学生数学建模E题财产保险的可持续模型详解思路+具体代码季节性时序预测SARIMA天气预测建模

源码版本,包含具体建模代码到生成模型步骤。

2024-02-05 11:25:22 813 21

原创 2024美国大学生数学建模E题财产保险的可持续模型详解思路+具体代码季节性时序预测SARIMA天气预测建模

上一篇已经对赛题进行详细分析了,而且大方向和基本的模型已经确定完毕,数据集都已经找到了,现在最重要的就是要分析风暴数据集以及建立时序预测模型,使用气候模型预测的数据,评估气候变化对未来极端天气事件频率和强度的影响。来看极端天气频率是否会上升,以及如何利用历史气象数据来支撑我们的模型效果。对于每个时序预测模型都有各自特点最优的使用场景,但是一般来说大部分时间序列数据都呈现出季节变化(Season)和循环波动(Cyclic)。对于在这些数据基础之上进行的建模一般最优是采用季节性时序预测SARIMA模型。

2024-02-03 16:51:43 1363 7

原创 2024美国大学生数学建模C题网球运动中的势头详解思路+具体代码

E题数据已更新,做E题的小伙伴推荐看看博主的E题解析文章。那么废话不多说我们继续来做C题。

2024-02-02 17:37:07 1574 6

原创 2024美国大学生数学建模E题财产保险的可持续模型详解思路+具体代码

很快啊!啪的一下拿到题目就开始做题!简单介绍一下我自己:博主专注建模五年,参与过大大小小数十来次数学建模,理解各类模型原理以及每种模型的建模流程和各类题目分析方法。参与过十余次数学建模大赛,三次美赛获得过二次M奖一次H奖,国赛二等奖。希望各位以后遇到建模比赛可以艾特一下我,我会提供免费的思路和源码,以后的数模比赛只要我还有时间肯定会第一时间写出免费开源思路。

2024-02-02 11:09:10 4974 76

原创 一文速学-selenium高阶操作连接已存在浏览器

不得不说selenium不仅在自动化测试作为不可或缺的工具,在数据获取方面也是十分好用,能够十分快速的见到效果,这都取决于selenium框架的足够的灵活性,甚至在一些基于web端的自动化办公都十分有效。通过selenium连接已经存在数据存储的浏览器,可以通过这种方式绕过短期内无法解决的验证码的识别,也可以绕过大部分网页保护措施。那么现在就来看看我们如何实现。

2024-01-30 16:16:35 2334 13

原创 2024最新PyQt5及其工具(Qt Designer、PyUIC、PyRcc)手把手操作实践指南

最近做了一些个人项目,内部逻辑还是挺多的,而且也有想要开源的想法,但是总不能直接把源码端给大家直接运行,有一些需求还有萌新小白用得上的,所以还得做一个可视化的UI。想了想能够通过Python建立的UI工具,在我印象中有PyQt5和tkinter这两个还算常见,wxPython没见过几个人用过,所有还是打算写一个PyQt5的教程入门文章带大家操作实践一下PyQt5的用法。之前网页或者博客很多篇都是PyQt5没有分离plugins,还有几个坑要注意一下。

2024-01-17 15:37:24 2665 30

原创 一文速学-selenium高阶性能优化技巧

最近写的挺多自动化办公的selenium程序没有做优化,执行效率不高,启动浏览器又慢但是又可能出现其他不可控的因素,总结来说虽然放心运行但是又没那么好用,项目是写完了最后还是需要优化结尾的。selenium程序优化空间还是非常大的,根据自己项目的需求来进一步精简,去区分哪些元素是我们要触发的,哪些不需要加载的,将这些优化目标写进去可以大大提高selenium程序的效率。

2024-01-15 15:46:44 4058 51

原创 详解动态网页数据获取以及浏览器数据和网络数据交互流程-Python

动态网页是一种在用户浏览时实时生成或变化的网页。。相比之下,动态网页可以根据用户的互动、请求或其他条件在浏览器端或服务器端生成新的内容。而且现在的网页一般都是采用前后端分离的架构,前端负责展示和用户交互,后端负责数据处理。这种架构使得前端可以更加灵活地实现动态内容的加载和展示。所以说以后想要获取到数据,动态网页数据获取会成为我们主流获取网页数据的技术。所以在动态网页数据获取这方面我们需要下足功夫了解动态网页数据交互形式、数据存储访问模式等方方面面的知识,我们才好更加灵活的获取到数据。

2024-01-12 13:59:49 4299 60

原创 Prompt提示工程上手指南:基础原理及实践(一)

在AI语境中,"Prompt"通常指的是向模型提出的一个请求或问题,这个请求或问题的形式和内容会影响模型的输出。例如:在一个文本生成模型中,提示可以是一个问题、一个话题或者是一段描述,模型根据这个提示生成相应的文本。Prompt工程是指人们向生成性人工智能(AI)服务输入提示以生成文本或图像的过程中,对这些提示进行精炼的过程。任何人都可以使用文言一心和DALL-E这样的生成器,通过自然语言来进行操作。这也是AI工程师在使用特定或推荐提示对大型语言模型(LLMs)进行精炼时使用的技术。

2024-01-05 11:36:17 2955 68

原创 详解静态网页数据获取以及浏览器数据和网络数据交互流程-Python

在网站设计领域,基于纯HTML格式构建的网页通常定义为静态网页,这种类型的网页是早期网站建设的主要形式。对于网络爬虫来说,抓取静态网页中的数据相对较为简单,因为所需的所有信息都直接嵌入在网页的HTML代码里。然而,对于那些利用AJAX技术动态加载数据的网页,其数据并不总是直接出现在HTML代码中,这对爬虫的抓取工作造成了一定的难度。在静态网页的数据抓取过程中,Requests库显示出其卓越的实用性。这个库不仅功能全面,而且操作简洁直观。

2024-01-03 11:00:47 3660 49

原创 一文详解Cookie以及Selenium自动获取Cookie

很多时候我们发现如果我们这网页上面登录过账号,下次再访问该网站就会发现不用再输入密码账号就能登录了。想象一下你去一家咖啡店。第一次去,你告诉店员你的名字和你喜欢的咖啡类型。店员记住了这些信息。下次你再去,店员看到你就知道你叫什么名字,也知道你喜欢什么咖啡,于是直接为你准备了你喜欢的咖啡。在这个例子中,咖啡店就像一个网站,你就像是访问网站的用户。你提供的名字和咖啡偏好就像是你在网站上输入的信息。咖啡店员记住你的信息,这就像网站在你的电脑上存储Cookie一样。

2023-12-29 15:05:06 3867 43

原创 千帆起航:探索百度智能云千帆AppBuilder在AI原生应用开发中的革新之路

我的个人经历也证明了千帆AppBuilder在加速开发流程和提高应用质量方面的能力。无论是RAG的复杂信息处理,Agent的交互设计,GBI的商业智能应用,还是文本框架的高效文本处理,千帆AppBuilder都显示出了其在AI原生应用开发中的关键作用。量方面的能力。无论是RAG的复杂信息处理,Agent的交互设计,GBI的商业智能应用,还是文本框架的高效文本处理,千帆AppBuilder都显示出了其在AI原生应用开发中的关键作用。

2023-12-25 08:45:56 4095 69

原创 【腾讯云云上实验室】基于向量数据的客户价值体系推荐系统设计

在了解以上推荐系统具体需求和面向对象种类之后,我们可以给推荐系统下个定义:推荐系统是一种工程技术解决方案,其核心在于通过运用机器学习等先进技术,实现在用户与产品互动的过程中主动呈现可能符合用户兴趣的物品。这样的系统旨在提高用户体验,通过精准的推荐,帮助用户更快地找到并消费符合其喜好的物品,从而节省用户时间和精力。一句话概括就是:推荐系统是工程技术解决方案,旨在通过智能化、个性化的推荐,实现资源的有效配置,满足用户需求,提高用户满意度,并在商业层面促进产品的销售和业务发展。

2023-11-24 19:23:12 17259 27

原创 目标分割技术-语义分割总览

博主现任高级人工智能工程师,曾发表多篇SCI且获得过多次国际竞赛奖项,理解各类模型原理以及每种模型的建模流程和各类题目分析方法。目的就是为了让零基础快速使用各类代码模型,每一篇文章都包含实战项目以及可运行代码。欢迎大家订阅一文速学-深度学习项目实战我们可以把目标分割拆解为两个技术实现部分:一为语义分割、二为实例分割。图像分类旨在判断该图像所属类别。目标检测是在图像分类的基础上,进一步判断图像中的目标具体在图像的什么位置,通常是以外包矩形(bounding box)的形式表示。

2023-11-21 10:01:17 2602 50

原创 机器/深度学习模型最优化问题详解及优化算法汇总

其实最优化问题,从小学开始学习数学的时候就可以说已经接触到了,在我印象中有个问题,用一个平底锅煎饼,每次只能放2只饼,煎一只饼要2分钟(正反各用1分钟),煎三只饼要几分钟。这个问题其实已经可以归为最优化问题,我们实际计算出的时间,和真实最节省的时间不断对比去调整煎饼方案,得到时间花费最短的方案,得到最优解。其实这个问题将对象换一下,将煎饼时间换为损失函数,将煎饼换为训练模型,那这个问题就是最优化问题了。

2023-11-10 08:45:58 3079 26

原创 生成模型常见损失函数Python代码实现+计算原理解析

既然存在生成内容与原有数据之间存在差距,那么有应该有度量二者差距的标量,损失函数就是度量两者直接的差距。损失函数的值告诉了优化算法应该如何更新模型的参数,以使模型的预测结果更接近实际数据。生成模型的损失函数值可以作为一个指标,用来评估模型的性能。通常情况下,我们希望损失函数越小越好,因为这意味着模型的预测结果越接近实际数据。通过选择合适的损失函数和正则化项,可以降低模型对训练数据的过拟合程度,提高模型在未见过数据上的泛化能力。

2023-11-03 15:42:27 2124 9

原创 损失函数(Loss Function)一文详解-聚类问题常见损失函数Python代码实现+计算原理解析

在聚类问题中,我们试图将数据集分成不同的组(簇),使得每个组内的数据点相似度较高,而不同组之间的相似度较低。聚类问题的目标是找到合适的簇划分,以最大程度地减小组内的差异,同时最大程度地增大组间的差异。在聚类问题中,并没有像监督学习中那样明确定义的损失函数,因为聚类问题通常是无监督学习,没有预先定义的目标变量。而聚类问题的损失函数通常用于度量簇划分的质量,并提供一种可优化的指标来衡量聚类结果的好坏。损失函数度量了每个簇内数据点的相似度,即簇内数据点之间的相似程度。

2023-11-02 14:37:23 3504 32

原创 损失函数(Loss Function)一文详解-回归问题常见损失函数Python代码实现+计算原理解析

损失函数无疑是机器学习和深度学习效果验证的核心检验功能,用于评估模型预测值与实际值之间的差异。我们学习机器学习和深度学习或多或少都接触到了损失函数,但是我们缺少细致的对损失函数进行分类,或者系统的学习损失函数在不同的算法和任务中的不同的应用。因此有必要对整个损失函数体系有个比较全面的认识,方便以后我们遇到各类功能不同的损失函数有个清楚的认知,而且一般面试以及论文写作基本都会对这方面的知识涉及的非常深入。故本篇文章将结合实际Python代码实现损失函数功能,以及对整个损失函数体系进行深入了解。

2023-11-01 09:36:00 5008 23

原创 目标检测算法发展史

目标检测无非做两个事情,一是检测出该目标在图片或者视频里面所处的位置以及该目标的类别。二是对于有多个目标的图片,检测出所有目标所处的位置及其类别。那么对于第一个要解决的问题,我们可以来了解具体需要干什么事情。

2023-10-30 17:05:59 3452 18

原创 图像去噪滤波算法汇总(Python)

综上所述,图像去噪是图像处理领域中的重要任务,其目的是消除或减弱图像中的噪音,以使图像更清晰、更易分析。不同的去噪算法适用于不同类型和强度的噪音,因此在实际应用中需要根据具体情况选择合适的方法。同时,对于特定的图像处理任务,也可能需要结合多种去噪技术以获得最佳效果。在实践中,通过理解各种去噪算法的原理和特性,可以更好地应用它们来解决实际问题,从而提升图像处理的质量和效率。

2023-10-26 17:13:01 4931 46

原创 图像数据噪音种类以及Python生成对应噪音

当涉及到图像处理和计算机视觉任务时,噪音是一个不可忽视的因素。噪音可以由多种因素引起,如传感器误差、通信干扰、环境光线变化等。这些噪音会导致图像质量下降,从而影响到后续的图像分析和处理过程。因此,对于从图像中获取准确信息的应用,我们需要有效地处理这些噪音。在本篇讨论中,我们将深入探讨图像数据中常见的几种噪音类型,以及相应的处理方法,旨在提升图像处理任务的准确性和稳定性。

2023-10-25 17:13:33 5571 38

原创 图像数据增强算法汇总(Python)

数据增强是一种通过使用已有的训练样本数据来生成更多训练数据的方法,可以应用于解决数据不足的问题。数据增强技术可以用来提高模型的泛化能力,减少过拟合现象。比如在狗猫识别项目中,通过随机旋转、翻转和裁剪等数据增强方法,可以使模型具有对不同角度和尺寸的狗猫图像的识别能力。增加训练样本数量:通过生成新样本,可以扩充训练集,提供更多样本供模型学习,从而减轻过拟合问题。提升模型的泛化能力:通过引入随机性,数据增强可以帮助模型学习到更多的通用特征,使其对新样本的泛化能力更强。增强模型的鲁棒性。

2023-10-24 17:39:06 4885 47

原创 各类深度学习框架详解+深度学习训练环境搭建-GPU版本

工欲善其事必先利其器,对工具的熟练程度很多时候决定你工程项目的质量和上限。对于人工智能工程师来说,搭建本地深度学习环境来说是比较麻烦的一件事,其中涉及到较多的相关硬件和软件的兼容问题。很多初学者安装的深度学习框架环境仅能够使用CPU运行并没有利用到GPU,关于很多硬件关联的深度学习训练框架并没有清楚的认知,导致配置环境的时候很容易出现各类错误。所以本篇文章主要讲述清楚如何搭建深度学习环境以及框架选择和自己硬件匹配的系统。如果你发现深度学习看似难以掌握,我将尽力简化知识,将其转化为我们更容易理解的内容。

2023-10-23 09:55:18 2620 66

原创 大模型时代如何拥抱原生AI?“云智一体”千帆改变AI格局

大模型正在引领着人工智能的全新时代,它们以前所未有的规模和复杂性刷新了我们对智能的理解。这些庞大的神经网络不仅仅是技术的突破,更是对于人工智能潜力的重新定义。它们赋予了机器前所未有的学习和推理能力,使得人工智能能够在语言、视觉、自然语言处理等领域取得了惊人的成就。大模型正成为解决现实世界复杂问题的利器,同时也催生了一系列前瞻性的AI原生应用,从而推动着整个产业向着更高、更广的方向迈进。这不仅仅是一次技术的飞跃,更是对未来的无限可能性的重新定义。AI大模型在ToC领域的商业模式,一直是个争议话题。

2023-10-19 11:21:21 1205 32

原创 CatBoost算法模型实现贷款违约预测

此篇文章为整个Boost(提升方法)集成算法模型的终章,前几篇文章依次结合详细项目案例讲解了共四个常用的集成算法模型,每一篇文章都包含实战项目以及可运行代码。仅通过看一遍文章不去实践是很难掌握集成算法模型的,其中很多思想和优化参数的方法需要长期使用才能掌握,集成学习的方法在全球各大机器学习、数据挖掘竞赛中使用的非常广泛,其概念和思想也是风靡学术界和工业界,所以有此需求的朋友推荐细读实践。之前我们已经详细描述了AdaBoost算法模型和GBDT原理以及实践。

2023-10-17 16:44:51 977 41

原创 VGG卷积神经网络实现Cifar10图片分类-Pytorch实战

VGGNet(Visual Geometry Group Network)是由牛津大学视觉几何组(Visual Geometry Group)提出的深度卷积神经网络架构,它在2014年的ImageNet图像分类挑战中取得了优异的成绩。VGGNet之所以著名,一方面是因为其简洁而高效的网络结构,另一方面是因为它通过深度堆叠的方式展示了深度卷积神经网络的强大能力。

2023-10-10 17:38:24 2265 39

chromedriver-linux64.zip 最新122.70

我们之所能操作浏览器,是因为我们有该浏览器对应的驱动。若是缺少驱动我们并不能对浏览器进行操作: 首先我们需要知道浏览器的版本,输入: chrome://version/ Selenium是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),火狐, 谷歌浏览器,360浏览器等。这个工具的主要功能包括:测试与浏览器的兼容性——测试应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成.Net、JAVA,PHP等不同语言的测试脚本。 2.功能 框架底层使用JavaScript模拟真实用户对浏览器进行操作。测试脚本执行时,浏览器自动按照脚本代码做出点击,输入,打开,验证等操作,就像真实用户所做的一样,从终端用户的角度测试应用程序。 使浏览器兼容性测试自动化成为可能,尽管在不同的浏览器上依然有细微的差别。 使用简单,可使用Java,Python等多种语言编写用例脚本。 ——

2024-02-29

chromedriver-122.0.6261.70-64

谷歌浏览器最新122.0.6261.70-32位驱动器selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器,如 Chrome、Firefox、Edge 等,还有 Android、BlackBerry 等手机端的浏览器。可以看到从122 Stable 稳定版本以及更高版本的测试版

2024-02-29

chromedriver-122.0.6261.70-32

谷歌浏览器最新122.0.6261.70-32位驱动器selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题selenium本质是通过驱动浏览器,完全模拟浏览器的操作,比如跳转、输入、点击、下拉等,来拿到网页渲染之后的结果,可支持多种浏览器,如 Chrome、Firefox、Edge 等,还有 Android、BlackBerry 等手机端的浏览器。可以看到从122 Stable 稳定版本以及更高版本的测试版,我们选择对应的版本复制链接到浏览器或者下载器里面就可以下载最新版本驱动了

2024-02-29

金融风控-贷款违约预测数据

赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。df2文件已经进行数据处理,具体可看博客:https://blog.csdn.net/master_hunter/article/details/129423185 Field Description id 为贷款清单分配的唯一信用证标识 loanAmnt 贷款金额 term 贷款期限(year) interestRate 贷款利率 installment 分期付款金额 grade 贷款等级 subGrade 贷款等级之子级 verificationStatus 验证状态 issueDate 贷款发放的月份 purpose 借款人在贷款申请时的贷款用途类别 postCode 借款人

2023-10-16

cchardet-2.7.1-cpy310

在https://www.lfd.uci.edu/~gohlke/pythonlibs/#cchardet上面没有看到支持python3.10版本的,但是在github上面人家发版了,先传自用,有需要可以下载。cchardet是chardet的升级版,功能和chardet完全一样(requests依赖包采用的就是chardet),用来检测一个字节数组的编码。由于是用C和C++实现的,所以它的速度非常快,非常适合在爬虫中用来判断网页的编码。

2023-04-13

jython-installer-2.7.3.jar

交互式实验-Jython提供了一个交互式解释器,可用于与Java包或运行的Java应用程序交互。这允许程序员使用Jython来实验和调试任何Java系统。 快速应用程序开发——Python程序通常比等效Java程序短2-10倍。这直接转化为程序员生产力的提高。Python和Java之间的无缝交互允许开发人员在开发过程中和产品交付过程中自由地混合这两种语言。

2022-10-26

已编译版本solr-8.11.2.tgz

Solr 8.11.2是8.x系列的最后一个版本,新版本已经是9.0版本了。 1,什么是solr? Solr是一个独立的企业级搜索应用服务器,他对外提供类似于Web-service的API接口。用户可以通过http请求,向搜索引擎服务提供一定格式的xml文件,生成索引;也可以通过http get 操作提供查找请求,并得到xml格式的返回结果 2.,solr特点 Solr是一个高性能,采用java语言,基于Lucene开发的全文搜索服务器。并对其进行了扩展,提供了比Lucene更为丰富的查询语言,同时实现了可配置,可扩展并对查询性能进行了优化,提供了一个完善的功能管理页面,是一款非常优秀的全文搜索引擎。 3,solr工作方式 文档通过http利用xml加到一个搜索集合中。solr查询该集合也是通过http收到一个xml/json响应来实现。他的主要特性包括:高效,灵活的缓存功能,垂直搜索功能,高亮下试搜索结果,通过索引复制来提高可用性,提供一套强大的data schema 来定义字段,类型和设置文本分析,提供基于web的管理界面等。

2022-08-26

apache-maven-3.8.6-bin+安装教程

远程仓库分类 分类 本地仓库 maven本地仓库的默认位置:无论是Windows还是Linux,在用户的目录下都有一个.m2/repository/的仓库目录,这就是Maven仓库的默认位置,变更maven默认的本地仓库的位置可更改存在于maven的settings.xml文件中localRepository的标签中的地址 远程仓库 中央仓库 maven官方的远程库,中央仓库包含了绝大多数流行的开源Java构件,以及源码、作者信息、SCM、信息、许可证信息等。一般来说,简单的Java项目依赖的构件都可以在这里下载得到 私服 私服是一种特殊的远程仓库,它是架设在局域网内的仓库服务,私服代理广域网上的远程仓库,供局域网内的Maven用户使用。当Maven需要下载构件的时候,它从私服请求,如果私服上不存在该构件,则从外部的远程仓库下载,缓存在私服上之后,再为Maven的下载请求提供服务。我们还可以把一些无法从外部仓库下载到的构件上传到私服上 其他公共库 mirror元素和rep

2022-08-24

hive3.1.0-antrl3.5.2-Hivegrammar源码.zip

Antlr是一种语言识别的工具,可以用来构造领域语言。 使用antlr需要我们提前定义好识别字符流的词法规则和用于解释Token流的语法分析规则。然后,antlr会根据我们提供的语法文件自动生成相应的词法/语法分析器。hive借助Antlr定义SQL的词法规则和语法规则,完成SQL词法,语法解析,将SQL转化为抽象语法树AST Tree。HiveSql后续的编译过程全都基于AST Tree,所以我们想要完整理解hive sql的编译过程,需要前置了解一下antlr是怎么工作的。 HiveLexer.g:词法解析文件,定义了所有用到的token。 HiveParser.g:语法解析文件,实现了所有的Hive语法解析。 FromClauseParser.g:FROM语句解析。 IdentifiersParser.g:自定义函数解析,标识符定义 函数名称、系统函数、关键字等。 nonReserved,非保留的关键字可以作为标识符的。比如 select a as date from mytable 这个date不添加转义会报错的,但是该处如果添加 “ | KW_DATE ” dat

2022-08-23

Dependency Walker2.2

Dependency Walker 之前一直用Dependency Walker看DLL导出接口,今天总结一下 Dependency Walker 使用说明。如果你想学习如何使用Dependency Walker, 可以仔细阅读这篇文章,了解一下Dependency Walker对你以后调试DLL有所帮助。 1.什么是DLL? 在Windows世界中,有无数块活动的大陆,它们都有一个共同的名字——动态链接库。现在就让我们走进这些神奇的活动大陆,找出它们隐藏已久的秘密吧! 初窥门径:Windows的基石 随便打开一个系统目录,一眼望去就能看到很多扩展名DLL的文件,这些就是经常说的“动态链接库”,DLL是Dynamic Link Library(即“动态链接库”)的缩写。从Microsoft公司推出首个版本的Windows以来,动态链接库就一直是这个操作系统的基础。 2.DLL有什么? 与其用晦涩的专业术语来解决DLL是什么,不如先来看看DLL里有什么。DLL和EXE文件一样,其中包含的也是程序的二进制执行代码和程序所需的资源(比如图标、对话框、字符串等),可是为什么要把代码放在D

2022-08-23

pyjnius-1.4.2-cp37-cp37m-win32.whl

PyJNIus 是一个神奇的 Python 第三方模块。它能使用Java本地接口将Java类作为Python类访问的Python模块。 如果你需要在Python中使用Java 类,这个第三方模块是你最好的选择。 1.准备 开始之前,你要确保Python和pip已经成功安装在电脑上 请选择以下任一种方式输入命令安装依赖: 1. Windows 环境 打开 Cmd (开始-运行-CMD)。 2. MacOS 环境 打开 Terminal (command+空格输入Terminal)。 3. 如果你用的是 VSCode编辑器 或 Pycharm,可以直接使用界面下方的Terminal. pip install pyjnius 2.快速开始 使用Jnius导入Java类特别简单,你只需要引入 autoclass 并引用你所需要的类即可: >>> from jnius import autoclass >>> autoclass('java.lang.System').out.println('Hello world') Hello world

2022-08-23

pyjnius-1.4.2-pp37-pypy37_pp73-win_amd64.whl

PyJNIus 是一个神奇的 Python 第三方模块。它能使用Java本地接口将Java类作为Python类访问的Python模块。 如果你需要在Python中使用Java 类,这个第三方模块是你最好的选择。适用场景:极个别的加密算法等内容,用python不方便实现或者实现较耗时,可基于Pyjnius把java类当做python库使用。如果出现ImportError,一般是java环境变量或者path没有配置好。先安装Java JDK 和JRE、Cython注意:jnius安装的坑比较多,请参考http://stackoverflow.com/search?q=jnius 如果出现ImportError,一般是java环境变量或者path没有配置好。 jnius/jnius.c:4:20: fatal error: Python.h 一般为缺python-dev, yum -y install python-devel pip 安装不成功可以尝试 setup.py方式。

2022-08-23

antlr-repackaged-4.0.jar

antlr是指可以根据输入自动生成语法树并可视化的显示出来的开源语法分析器。ANTLR—Another Tool for Language Recognition,其前身是PCCTS,它为包括Java,C++,C#在内的语言提供了一个通过语法描述来自动构造自定义语言的识别器(recognizer),编译器(parser)和解释器(translator)的框架。 antlr有 v2 v3 v4多个版本并存,中文文档多数是v2的, hive 1.1.0版本在注释中提到了antlr 3.4。ANTLR将上述结合起来,它允许我们定义识别字符流的词法规则和用于解释Token流的语法分析规则。然后,ANTLR将根据用户提供的语法文件自动生成相应的词法/语法分析器。用户可以利用他们将输入的文本进行编译,并转换成其他形式(如AST—Abstract Syntax Tree,抽象的语法树)。

2022-08-23

antlrworks-1.5.1.jar

Antlr是一种语言识别的工具,可以用来构造领域语言。 使用antlr需要我们提前定义好识别字符流的词法规则和用于解释Token流的语法分析规则。然后,antlr会根据我们提供的语法文件自动生成相应的词法/语法分析器。hive借助Antlr定义SQL的词法规则和语法规则,完成SQL词法,语法解析,将SQL转化为抽象语法树AST Tree。HiveSql后续的编译过程全都基于AST Tree,所以我们想要完整理解hive sql的编译过程,需要前置了解一下antlr是怎么工作的。通过ANTLRWorks可以更加直观的理解解析过程。 对ANTLR的支持——源代码图。编辑ANTLR语法文件时,“语法图”窗口显示当前规则的直观表示。此功能提供语法元素的自然表示,并且是提供自定义功能以增强特定语言的特征的示例。另外,双击源代码图中的元素将立即跳转到相关的源代码。antlrworks:专门用于开发antlr的ide,(不同版本的antlrworks)其内部集成了某个版本的antlr。 换句话说,你即使下载了antlr-x.x-complete.jar,将其添加到了CLASSPATH中,其也和an

2022-08-22

antlr-3.4.jar

antlr是指可以根据输入自动生成语法树并可视化的显示出来的开源语法分析器。ANTLR—Another Tool for Language Recognition,其前身是PCCTS,它为包括Java,C++,C#在内的语言提供了一个通过语法描述来自动构造自定义语言的识别器(recognizer),编译器(parser)和解释器(translator)的框架。 antlr有 v2 v3 v4多个版本并存,中文文档多数是v2的, hive 1.1.0版本在注释中提到了antlr 3.4。ANTLR将上述结合起来,它允许我们定义识别字符流的词法规则和用于解释Token流的语法分析规则。然后,ANTLR将根据用户提供的语法文件自动生成相应的词法/语法分析器。用户可以利用他们将输入的文本进行编译,并转换成其他形式(如AST—Abstract Syntax Tree,抽象的语法树)。

2022-08-22

hadoop3.3.3-winutils

Scala项目中的winutils.exe详解 作用: 模拟linux环境 意义: hadoop基于linux开发和布署运行,故不能将hadoop环境原始运行在windows上。 操作系统环境差异说明 因为模拟linux环境,所以在linux原生环境中就不需要他了 在windows环境中需要配置 如何配置: 配置到运行环境当前目录下的/bin目录下 如果是eclipse开发,就配置到项目根目录下/bin/下即可 在Hadoop1.x 时代,Hadoop中的MapReduce同时处理业务逻辑运算和资源的调度,耦合性较大。 在Hadoop2.x时代,增加了Yarn。Yarn只负责资源的调度,MapReduce 只负责运算。 Hadoop3.x在组成上没有变化Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。 (1)NameNode(nn):存储文件的元数据,如文件名,文件目录结构,文件属性(生成时间、副本数、文件权限),以及每个文件的块列表和块所在的DataNode等。 (2)DataNode(dn):在本地文件系统存储文件块数据,以及块

2022-07-19

scrt-sfx-9.0.0.2430+使用教程

内带使用教程你懂得! SecureCRT 9.1是一款专业强大的SSH远程终端服务软件,该软件在所以平台上都支持SSH2,SSH1,Telnet,串行和Raw。从多种仿真中选择大多数采用ANSI颜色。具有多会话选项样式或者平铺式界面,具有大范围的会话管理以及自定义功能。使用时用户可以创建在指定会话的基础上使用各个配置。并且这款软件整体界面简洁,操作方便易用,支持可视化界面,将本地主机和远程主机的目录结构以树形结构的方式显示出来,文件的传输可以直接手动拖动而无需使用命令。 同时,SecureCRT 9.1版本进行了全方面的新增和优化,支持在会话管理器过滤器框中使用通配符,优化搜索以显示您感兴趣的确切会话,最大程度地减少错误,还提供了新的自定义选项,新增了对Python 3的支持,对选定文本进行Google搜索的功能以及对多行粘贴确认的增强等等,致力于为组织中的每个人提供安全的远程访问、文件传输和数据隧道。添加了Windows、macOS和Linux支持本地Shell;新增书签管理器,使您可以更轻松地添加,删除书签,以及从其他会话中复制书签,提高用户工作效率。

2022-06-13

机器学习之数据均衡算法种类大全+Python代码一文详解

以Imbalancd sklearn库收录的算法来看,过采样共有11种方法,欠采样共有8种方法,组合采样有2种方法。 1.欠采样算法: ClusterCentroids CondensedNearestNeighbour EditedNearestNeighbours RepeatedEditedNearestNeighbours AlIKNN InstanceHardnessThreshold NearMiss NeighbourhoodCleaningRule OneSidedSelection RandomUnderSampler TomekLinks 2.过采样方法 RandomOverSampler SMOTE SMOTENC SMOTEN ADASYN BorderlineSMOTE KMeansSMOTE SVMSMOTE 3.组合采样 SMOTEENN SMOTETomek

2022-06-05

dbeaver+navicat

DBeaver 是一个基于 Java 开发,免费开源的通用数据库管理和开发工具,使用非常友好的 ASL 协议。可以通过官方网站或者 Github 进行下载。 由于 DBeaver 基于 Java 开发,可以运行在各种操作系统上,包括:Windows、Linux、macOS 等。DBeaver 采用 Eclipse 框架开发,支持插件扩展,并且提供了许多数据库管理工具:ER 图、数据导入/导出、数据库比较、模拟数据生成等。 DBeaver 通过 JDBC 连接到数据库,可以支持几乎所有的数据库产品,包括:MySQL、PostgreSQL、MariaDB、SQLite、Oracle、Db2、SQL Server、Sybase、MS Access、Teradata、Firebird、Derby 等等。商业版本更是可以支持各种 NoSQL 和大数据平台:MongoDB、InfluxDB、Apache Cassandra、Redis、Apache Hive 等。“Navicat”是一套可创建多个连接的数据库管理工具,用以方便管理 MySQL、Oracle、PostgreSQL、SQLite、

2022-05-30

sqldeveloper-21.4.3.x64+jdk1.8

Oracle SQL Developer是Oracle公司出品的一个免费的集成开发环境。是一个免费非开源的用以开发数据库应用程序的图形化工具,使用 SQL Developer 可以浏览数据库对象、运行 SQL 语句和脚本、编辑和调试 PL/SQL 语句。另外还可以创建执行和保存报表。该工具可以连接任何 Oracle 9.2.0.1 或者以上版本的 Oracle 数据库,支持 Windows、Linux 和 Mac OS X 系统。 Oracle SQL Developer是针对Oracle数据库的交互式开发环境(IDE)。 Oracle SQL Developer简化了Oracle数据库的开发和管理。 SQL Developer提供了PL/SQL程序的端到端开发,运行查询工作表的脚本,管理数据库的DBA控制台,报表接口,完整的数据建模的解决方案,并且能够支持将你的第三方数据库迁移至Oracle。 SQL Developer可以连接到任何Oracle 10g及其后续版本的数据库,并且能在 是连接Hive以及mysql常用的图形化工具之一,此安装包还自带jdk1.8.可以直接部署进行开发。

2022-05-26

熵权法实战代码,根据港口研发投入数据进行熵值法确定权重。

熵权法实战代码,根据港口研发投入数据进行熵值法确定权重。

2022-02-28

hadoop-common-2.6.0-bin-master.zip

设置本地为master而进行hadoop编程所必须文件

2021-04-07

操作系统调度算法.zip

操作系统作业调度算法C代码实现,进程入队与出队模拟,FCFS调度算法,时间片轮转调度算法

2021-03-04

机器学习实战Logistic回归举例数据

本资源是机器学习实战Logistic回归举例中的数据

2020-12-20

使用朴素贝叶斯过滤垃圾邮件数据集

数据集说明: 数据集下包含两个文件夹,其中spam文件夹下为垃圾邮件,ham文件夹下为非垃圾邮件。  数据集格式: txt文件

2020-12-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除