自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(69)
  • 收藏
  • 关注

原创 github加速神器!解决github巨慢的问题,并且能够加速下载!另外推荐GitKraken -- 超好用的 Git 可视化工具

github加速神器,解决github打不开、用户头像无法加载、releases无法上传下载、git-clone、git-pull、git-push失败等问题。

2024-03-28 18:00:26 407 1

原创 爬虫高阶(一):解决验证码及爬取知网论文数据

实现了自动化解决验证码及爬取数据

2024-03-20 15:18:01 1696

原创 简单的思考(一):MATLAB实现心形线

于是想着自己能不能也做出来。

2024-03-14 13:40:26 535

原创 深度学习(十一):YOLOv9之最新的目标检测器解读

在追求最佳实时物体检测的过程中,YOLOv9 以其创新的方法克服了深度神经网络固有的信息丢失难题,脱颖而出。通过整合 PGI 和多功能 GELAN 架构,YOLOv9 不仅增强了模型的学习能力,还确保了在整个检测过程中保留关键信息,从而实现了卓越的准确性和性能。

2024-03-12 23:50:17 1652 1

原创 数据库(一):基本语法一

数据库作业

2024-03-12 22:08:03 429

原创 爬虫之牛刀小试(十一):爬取某东关于手机的评论

我爬了某东上万条评论!

2024-02-16 21:14:08 1005

原创 爬虫之牛刀小试(十):爬取某宝手机商品的销量,价格和店铺

原来爬取商品数据如此简单

2024-02-16 21:10:14 1000

原创 爬虫之牛刀小试(九):爬取小说

最近新开了公众号,请大家关注一下。今天爬取的是一本小说。

2024-01-24 22:10:14 455

原创 爬虫之牛刀小试(八):爬取微博评论

可以发现其特点是下一页评论的max_id在上一页中。最近新开了公众号,请大家关注一下。今天爬取的是微博评论。

2024-01-19 23:39:53 1202

原创 爬虫之牛刀小试(七):爬取某二手车网站

关键在于clue_id怎么获取,发现在其上一个网页中有clue_id,于是就解决了。最近新开了公众号,请大家关注一下。今天爬取的是某二手车网站。

2024-01-17 11:24:56 401

原创 Github Copilot最全的安装与使用教程:一款非常好用的AI编程工具

在你安装完Github Copilot后,你会发现VSCODE左边多了Github Copilot的聊天窗口,你可以像Chatgpt一样和Github Copilot聊天,Github Copilot不仅根据你的要求生成代码,而且还会对代码进行说明,最重要的是Github Copilot会提示你联想的代码问题,增加你的代码水平。**到这一步了,你的VSCODE就拥有了Github Copilot!,等待官方发给你邮件,提示你可以用的时候,你就可以免费地使用了。你需要提供你的学生证照片,

2024-01-14 19:27:51 2001

原创 爬虫之牛刀小试(六):爬取BOSS网站招聘的内容

想要找到我们感兴趣的职位,随便举个例子吧,比如家教啥的。接着找到对应的位置让selenium自己干就行了。最近新开了公众号,请大家关注一下。今天决定再次尝试一下。找到我们感兴趣的内容。

2024-01-14 18:01:47 511

原创 爬虫之牛刀小试(五):爬取B站的用户评论

接着我们的目标要获取多个网址(类似于https://api.bilibili.com/x/v2/reply/wbi/main?使用selenium来模仿人的动作,获取多个网址,关键是B站需要登陆就很难受,不知道为什么Cookie用不了,只好手动操作一下了。此次共读取了20X10共计200条评论,每一个网址有20条评论,需要花费大约30s左右,共计爬十个。小小地出手一下,这次使用selenium来自动化进行爬取,虽然速度很慢,但是还可以接受。找到你想要的值,对了,时间记得要转化一下,不然会出错!

2024-01-13 23:26:44 734

原创 爬虫之牛刀小试(四):爬取B站番剧的简介

每个作品对应一个链接: https://www.bilibili.com/bangumi/play/ss…于是肯定了对应的api接口:api.bilibili.com /pgc/review/user?获取每部番剧的title和url就行,接着只要匹配获取简介的内容就行了。User-Agent和cookie用自己的,具体可以自行搜索如何操作。我们只要选出我们感兴趣的内容,比如配音演员,硬币等内容。首先我们来到番剧索引中,随便点开一部动漫,检查代码。这样子就解决了如何爬取每部番剧的网址了。

2024-01-13 16:56:47 582

原创 爬虫之牛刀小试(三):爬取中国天气网全国天气

paser_url(url) 函数用于解析每个区域页面的 HTML,提取出城市名、最高温度、最低温度、风向、风级和天气数据,并将这些数据以字典的形式添加到 ALL_DATA 列表中。使用了 requests 库来发送 HTTP 请求,使用 BeautifulSoup 库来解析 HTML,使用 time 库来暂停执行。spider() 函数遍历所有区域的 URL,对每个 URL 调用 paser_url(url) 函数,并在每次调用后暂停 1 秒。最近新开了公众号,请大家关注一下。

2024-01-11 16:33:33 424

原创 爬虫之牛刀小试(二):爬古诗文网的数据

spider_page(url): 这个函数从给定的 URL 获取古诗。它首先发送一个 GET 请求到 URL,然后解析返回的 HTML 文档,提取出诗词的标题、朝代、作者、内容和图片 URL。spider(): 这是主函数,它遍历诗词列表页的 URL,对每个诗词列表页调用 spider_page(url) 函数获取诗词信息,然后将所有诗词的信息打印出来。这次利用的是re,上一篇用的是xpath和bs4。最近新开了公众号,请大家关注一下。

2024-01-11 15:43:43 946

原创 爬虫之牛刀小试(一):爬取电影天堂最新的电影数据

spider(): 这是主函数,它遍历电影列表页的 URL,对每个电影列表页调用 get_detail_urls(url) 函数获取电影详情页的 URL,然后对每个电影详情页的 URL 调用 parse_detail_urls(detail_url) 函数解析电影信息,最后将所有电影的信息打印出来。它首先发送一个 GET 请求到电影详情页 URL,然后解析返回的 HTML 文档,提取出电影的标题、封面图片 URL、年份、国家、类别、豆瓣评分、片长、导演、主演、简介、截图和下载链接。

2024-01-11 14:50:16 572

原创 2023下半年的总结

为了提高算法的性能和准确性,可以采用特征选择(包裹式,过滤式,嵌入式)、特征降维(PCA,t_sne)和模型集成(boost,stacking,bagging)等技术。同时,我也学习了Simulink的使用方法,通过建立数学模型进行系统仿真和分析。对于人脸识别,可以采用了基于深度学习的特征提取方法,通过训练卷积神经网络(CNN)来提取人脸特征,并使用余弦相似度进行特征匹配,实现人脸的快速识别。对于问答系统,采用了基于知识图谱的方法,通过构建知识图谱来存储问题和答案的对应关系,并使用搜索算法进行答案的检索。

2023-12-31 19:18:08 1139

原创 matalb实践(十二):减肥

1.体重增加正比于吸收的热量,平均每8000kcal增加体重1kg2.身体正常代谢引起的体重减少正比于体重,每周每千克体重消耗热量一般在200kcal至320kcal之间,且因人而异,这相当于体重70kg的人每天消耗2000kcal至3200kcal3.运动引起的体重减少正比于体重,且与运动形式和运动时间有关4.为了安全与健康,每周吸收热量最好不要小于10000kcal,且每周减少量不要超过1000kcal,每周体重减少不要超过1.5kg。

2023-12-31 19:13:50 1126

原创 深度学习(十):MFTN多模态融合

多模态情感分析(Moglobal et al.,2011;Zadeh等人,2016 b;Jiang et al.,2015)是情感计算研究的一个越来越受欢迎的领域(Escherichet al.,2017年),专注于将基于文本的情感分析推广到固执己见的视频,其中存在三种沟通方式:语言(口语),视觉(手势)和声学(语音)。如图所示,“这部电影很恶心”的话语本身可能是模糊的(积极或消极的),但如果说话者同时也在微笑,那么它将被视为积极的。另一方面,同样的话语与皱眉将被视为负面的。

2023-12-27 20:53:01 1352

原创 模式识别与机器学习(十三):Stacking

在本次实验中以决策树、svm和随机森林为基学习器,以决策树为元学习器。Stacking的做法是首先构建多个不同类型的一级学习器,并使用他们来得到一级预测结果,然后基于这些一级预测结果,构建一个二级学习器,来得到最终的预测结果。Stacking的动机可以描述为:如果某个一级学习器错误地学习了特征空间的某个区域,那么二级学习器通过结合其他一级学习器的学习行为,可以适当纠正这种错误。具体步骤如下图所示:过程1-3 是训练出来个体学习器,也就是初级学习器。

2023-12-27 20:32:08 445

原创 java实战(六):MySQL数据库实现student管理项目

使用Navicat16可视化得到。

2023-12-27 20:27:36 451

原创 模式识别与机器学习(十二):随机森林

随机森林(Random Forest, RF)是Bagging的一个扩展变体。RF在以决策树为基学习器构建Bagging集成的基础上,在决策树的训练过程中引入随机属性选择。训练每颗决策树时随机选出部分特征作为输入,所以该算法被称为随机森林算法。在RF中,对基决策树的每个结点,先从该结点的属性集合中随机选择一个包含k个属性的子集(假定有d个属性),然后再从这个子集中选择一个最优属性用于划分。参数k控制了随机性的引入程度,一般情况下推荐klog2​d。

2023-12-26 13:30:51 588 2

原创 深度学习(九):bert之代码实现

处理的过程包括:将标签移动到指定的设备,将数据传递给模型得到预测结果,将预测结果的最大值的索引作为预测的类别,然后将预测结果和标签转换为列表,最后添加到总的预测结果和真实标签中。这些参数包括训练、验证和测试数据的文件路径,BERT预训练模型的路径,分类的数量,最大文本长度,批次大小,训练周期数,学习率,BERT模型的过滤器数量,以及最佳模型和最后模型的保存路径。处理的过程包括:将标签移动到指定的设备,将数据传递给模型得到预测结果,计算损失,清空优化器的梯度,反向传播,更新参数,累加损失。

2023-12-26 13:26:02 1136 1

原创 模式识别与机器学习(十一):Bagging

Bagging [Breiman, 1996a] 是井行式集成学习方法最著名的代表.从名字即可看出,它直接基于自助采样法(bootstrap sampling)。给定包含m 个样本的数据集,我们先随机取出一个样本放入采样集中,再把该样本放回初始数据集,使得下次采样时该样本仍有可能被选中,这样,经过m次随机采样操作,我们得到含m 个样本的采样集,初始训练集中有的样本在采样集里多次出现,有的则从未出现,初始训练集中约有63.2%的样本出现在来样集中。

2023-12-23 22:29:11 692

原创 模式识别与机器学习(十):梯度提升树

提升方法实际采用加法模型(即基函数的线性组合)与前向分步算法。以决策树为基函数的提升方法称为提升树(boosting tree)。对分类问题决策树是二叉分类树,对回归问题决策树是二叉回归树。θm​其中,Tx;θm​表示决策树,θm​为决策树参数,M为树的个数。而梯度提升树的具体步骤如下:1.初始化f0​x0,并选取损失函数Lyfx));2.对于m01⋯M−gm​xi​−∂f。

2023-12-23 22:23:42 1398

原创 模式识别与机器学习(九):Adaboost

AdaBoost是Adaptive Boosting(自适应增强)的缩写,它的自适应在于:被前一个基本分类器误分类的样本的权值会增大,而正确分类的样本的权值会减小,并再次用来训练下一个基本分类器。同时,在每一轮迭代中,加入一个新的弱分类器,直到达到某个预定的足够小的错误率或预先指定的最大迭代次数再确定最后的强分类器。各个弱分类器的训练过程结束后,加大分类误差率小的弱分类器的权重,使其在最终的分类函数中起着较大的决定作用,而降低分类误差率大的弱分类器的权重,使其在最终的分类函数中起着较小的决定作用。

2023-12-23 22:15:31 1227

原创 matlab实践(十一):导弹追踪

试探法得到t=0.3125,dy=0.9910,由公式一得到dx。对于第二题做法是求出中间时刻t,dx,dy再列方程求解。红色是加速前的轨迹,蓝色是加速后的轨迹。更改函数中的v0可以得到不同的轨迹。接着利用ode45求解。

2023-12-23 21:58:36 1667 2

原创 模式识别与机器学习(八):决策树

决策树(Decision Tree),它是一种以树形数据结构来展示决策规则和分类结果的模型,作为一种归纳学习算法,其重点是将看似无序、杂乱的已知数据,通过某种技术手段将它们转化成可以预测未知数据的树状模型,每一条从根结点(对最终分类结果贡献最大的属性)到叶子结点(最终分类结果)的路径都代表一条决策的规则。一般,一棵决策树包含一个根节点,若干个内部结点和若干个叶结点。叶结点对应于决策结果,其他每个结点对应于一个属性测试。

2023-12-23 21:38:46 1830

原创 深度学习(八):bert理解之transformer

transformer 是一种深度学习模型,主要用于处理序列数据,如自然语言处理任务。它在 2017 年由 Vaswani 等人在论文 “Attention is All You Need” 中提出。Transformer 的主要特点是它完全放弃了传统的循环神经网络(RNN)和卷积神经网络(CNN),而是完全依赖于注意力机制(Attention Mechanism)来捕捉输入序列中的模式。

2023-12-23 21:27:04 1609

原创 深度学习(七):bert理解之输入形式

因此,预训练的BERT模型只需添加一个额外的输出层,就可以用于各种任务,如问答和语言推理,而无需进行大量的任务特定架构修改。为了使得BERT模型适应下游的任务(比如说分类任务,以及句子关系QA的任务),输入将被改造成[CLS]+句子A(+[SEP]+句子B+[SEP]) 其中。在BERT中,输入的向量是由三种不同的embedding求和而成,在以下所举的例子中,每个单词都表示为一个768维的向量。1.[CLS]: 代表的是分类任务的特殊token,它的输出就是模型的pooler output。

2023-12-23 20:43:08 1717

原创 深度学习(六):paddleOCR理解及识别手写体,手写公式,表格

光学字符识别(Optical Character Recognition, OCR),ORC是指对包含文本资料的图像文件进行分析识别处理,获取文字及版面信息的技术,检测图像中的文本资料,并且识别出文本的内容。那么有哪些应用场景呢?其实我们日常生活中处处都有ocr的影子,比如在疫情期间身份证识别录入信息、车辆车牌号识别、自动驾驶等。我们的生活中,机器学习已经越来越多的扮演着重要角色,也不再是神秘的东西。OCR的技术路线是什么呢?ocr的运行方式:输入->图像预处理->文字检测->文本识别->输出。

2023-12-06 23:48:59 3331 5

原创 matlab实践(十):贝塞尔曲线

贝塞尔曲线的原理是基于贝塞尔曲线的数学表达式和插值算法。贝塞尔曲线的数学表达式可以通过控制点来定义。对于二次贝塞尔曲线,它由三个控制点P0、P1和P2组成,其中P0和P2是曲线的起点和终点,P1是曲线上的一个中间点。曲线上的每个点可以通过参数t在0到1之间的取值来计算,公式如下:其中,B(t)表示曲线上的点,t表示参数值,(1-t)表示参数值的补数。对于三次贝塞尔曲线,它由四个控制点P0、P1、P2和P3组成,其中P0和P3是曲线的起点和终点,P1和P2是曲线上的两个中间点。

2023-12-06 21:06:00 1897 1

原创 深度学习(五):pytorch迁移学习之resnet50

迁移学习是一种机器学习方法,它通过将已经在一个任务上学习到的知识应用到另一个相关任务上,来改善模型的性能。迁移学习可以解决数据不足或标注困难的问题,同时可以加快模型的训练速度。迁移学习的核心思想是将源领域的知识迁移到目标领域中。源领域是已经有大量标注数据的领域,而目标领域是需要解决的新问题。通过迁移学习,源领域的知识可以帮助目标领域的学习过程,提高模型的泛化能力和性能。迁移学习可以通过多种方式实现,包括特征提取、模型微调和领域自适应等方法。

2023-12-04 21:10:09 3600 1

原创 matlab实践(九):分段线性插值与三次样条插值

用matlab对572所在区间分别进行分段线性插值、三次样条插值,计算出151,159,984,995的对数值,画出图形并在图形上用红色圆圈标记151,159,984,995所在的点,同时在图形中显示这些点的坐标。说明:假设125,528,765;则插值区间为【120,770】

2023-12-04 19:40:39 2439

原创 模式识别与机器学习(七):集成学习

例如,如果有5个个体学习器,它们的权重分别为[0.2, 0.3, 0.1, 0.2, 0.2],则最终的预测结果是将个体学习器的预测结果乘以对应的权重后相加得到的。每个个体学习器对样本进行预测后,最终的预测结果是通过对个体学习器的预测结果进行平均得到的。然后,我们将数据集拆分为训练集和测试集。在集成学习中,个体学习器可以是同质的(使用相同的学习算法,但在不同的训练集上训练)或异质的(使用不同的学习算法)。每个基本学习器都是在不同的训练集上独立训练得到的,最后通过集成基本学习器的预测结果来进行最终的预测。

2023-12-02 22:59:47 1343

原创 深度学习(四):pytorch搭建GAN(对抗网络)

生成对抗网络(GAN)是一种深度学习模型,由两个网络组成:生成器(Generator)和判别器(Discriminator)。生成器负责生成假数据,而判别器则负责判断数据是真实的还是 fake的。这两个网络互相竞争,生成器试图生成更真实的数据以欺骗判别器,而判别器则试图更好地识别生成的数据。GAN 的基本思想是:通过训练生成器和判别器,使得生成器能够生成与真实数据非常相似的数据,同时使得判别器能够更有效地识别这些数据。

2023-12-02 22:17:55 1634 1

原创 java实战(五):理解多线程与多线程实现冒泡排序及可视化

共享变量:多个线程可以通过共享的变量进行通信。互斥:线程互斥是指多个线程之间对共享资源的访问进行控制,保证同一时间只有一个线程可以访问共享资源,避免数据的不一致性和冲突。需要注意的是,线程的状态不是固定的,线程可以在不同的状态之间转换。线程的创建和调度由操作系统负责,它会为每个线程分配资源,并按照一定的调度策略来决定线程的执行顺序。同步和互斥机制可以保证线程之间的协作和共享资源的安全访问,避免了数据竞争和不一致性的问题。需要注意的是,在使用同步和互斥机制时,要避免死锁和活锁等问题,合理设计和使用锁定机制。

2023-12-02 14:53:07 933

原创 深度学习(三):pytorch搭建卷积神经网络

这行代码是用来选择设备的,根据是否有可用的 CUDA 设备来选择使用 GPU 还是 CPU 进行计算。:这个函数用来检查是否有可用的 CUDA 设备。如果返回True,表示有可用的 CUDA 设备;如果返回False,表示没有可用的 CUDA 设备。"cuda:0"和"cpu":这是设备的标识符。"cuda:0"表示选择第一个可用的 CUDA 设备,而"cpu"表示选择 CPU 设备。:这是一个用来表示设备的类。通过传入设备标识符,可以创建一个设备对象。

2023-11-30 23:31:31 1297

原创 java实战(四):编写学生信息管理系统页面·

编写程序 实现表格的输入和编辑功能。界面如下:1、用户按插入键后,把学号、姓名和成绩插入到最后一行,序号显示当前的行号。2、当用户选中表格的某一行时,按删除按钮,则这一行从表格中删除3、编辑功能,用户可以直接双击表格上的某一行进行内容编辑,例如修改成绩或者姓名,学号。4、表格的内容保存到一个文件中,等下一次程序启动时重新加载保存的内容到表格中。

2023-11-30 17:34:29 644

推荐GitKraken - 超好用的 Git 可视化工具

推荐GitKraken -- 超好用的 Git 可视化工具

2024-03-28

爬虫高阶(一):解决验证码及爬取知网论文数据

用于实现爬取论文数据

2024-03-20

中文预训练模型,实现bert

经典预训练模型

2023-12-26

2019年到2022年美赛近几年的优秀论文及题目,对于参加美赛的同学有用

这是2019年到2022年美赛近几年的优秀论文及题目,分量巨大,希望对于参加美赛的同学有用。

2023-12-06

深度学习(五):pytorch迁移学习之resnet50

实现了resnet50,对网络结构进行微调,优化器也选择了余弦退火策略

2023-12-04

yolov8-1.zip

适用于对有关机器视觉领域感兴趣的小伙伴们下载,这里包含在复杂果园情况下对苹果进行检测,包含yolov8数据集和实现目标检测的代码

2023-12-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除