自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(32)
  • 收藏
  • 关注

原创 爬取豆瓣电影top前250的电影信息

豆瓣电影是一个汇集了大量电影信息和用户评价的平台,它为电影爱好者提供了一个发现、讨论和评价电影的社区。豆瓣电影的数据丰富,包括电影的基本信息(如名称、评分、导演、主演等)、用户评论、评分分布等,这些数据对于电影研究、市场分析以及个人兴趣探索都具有重要价值。制作思路爬虫通过模拟浏览器行为,向豆瓣电影服务器发送HTTP请求,获取网页内容。这一步需要设置合适的请求头,以模拟真实用户的浏览器访问,避免被网站的反爬机制识别。获得网页的HTML内容后,爬虫需要从这些内容中提取出有用的数据。

2025-01-15 00:18:47 1907

原创 99%的人都不知道辗转相除法求最大公约数

辗转相除法,也称为欧几里得算法,是一种高效的计算两个非负整数最大公约数(GCD)的方法。这种方法基于一个原理:两个整数的最大公约数不变,即使其中一个数加上另一个数的倍数。具体的计算过程是通过不断进行除法运算,直到余数为0,此时的除数就是这两个数的最大公约数。

2025-01-22 18:17:24 187

原创 python解奥赛运算题

有一个以文字代替数字的算术表达式如下图所示,已知4个替代数字的文字中没有重复,编写程序求出文字所替代的数字。按逻辑思维:如果3位数和3位数相加等于4位数,则“青”只能是1:“山”+“青”大于等于10,因此“山”只能是9,得出“龙”是0:个位的两个“山”相加,推得“外”等于8。而按计算思维,则注重于程序的实现,用穷举法设计嵌套的4层循环,把所有的数字都试一遍,找出4个数字不相互重复的合满足加法等式条件。

2025-01-22 18:02:58 368

原创 python麻辣香锅菜品推荐

推荐算法出现得很早,最早的推荐系统是卡耐基·梅隆大学推出的Web Watcher浏览器导航系统,可以根据当的搜索目标和用户信息,突出显示对用户有用的超链接。斯坦福大学则推出了个性化推荐系统LIRA.AT&T实验室于1997年提出基于协作过滤的个性化推荐系统,通过了解用户的喜好和需求,能更精确地呈现相关内容。在Facebook自2006年开始引领互联网社交新潮流之后,推荐系统真正与互联网产品相结合。

2025-01-21 22:17:25 412

原创 python高级加密算法AES对信息进行加密和解密

(高级加密标准)是一种广泛使用的对称加密算法,它以字节为单位处理数据,将明文分组加密成密文。AES算法的核心在于一个轮函数,该函数会对数据执行多次变换,包括字节代换、行移位、列混合和轮密钥加。这些操作确保了数据的安全性,使得原始数据经过AES加密后变得无法识别。

2025-01-21 16:31:39 968

原创 python转转商超书籍信息爬虫

网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等,可以按照我们设置的规则自动化爬取网络上的信息,这些规则被称为爬虫算法。是一种自动化程序,用于从互联网上抓取数据。爬虫通过模拟浏览器的行为,访问网页并提取信息。这些信息可以是结构化的数据(如表格数据),也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。

2025-01-20 22:58:50 1628

原创 python国产进口电影票房榜单数据可视化(可视化大屏)

python国产进口电影票房榜单数据可视化

2025-01-20 22:34:51 453

原创 机器学习皮马印第安人糖尿病数据集预测报告

本研究在充分调研的前提下,利用皮马印第安人糖尿病数据集,利用Python中的随机森林、决策树、逻辑回归等多种机器学习算法,构建起糖尿病风险预警系统,用户可将自身信息输入到系统中,系统会自动分析是否具有糖尿病的风险,为用户和医生进行健康筛查提供帮助。充分调研的前提下,利用皮马印第安人糖尿病数据集,利用Python中的随机森林、决策树、逻辑回归等多种机器学习算法,构建起糖尿病风险预警系统,用户可将自身信息输入到系统中,系统会自动分析是否具有糖尿病的风险,为用户和医生进行健康筛查提供帮助。由于数据集较小,共有。

2025-01-18 23:50:55 883

原创 机器学习加州房价预测模型报告

任务是利用加州普查数据,建立一个加州房价模型。这个数据包含每个分区组的人口、收入中位数、房价中位数等指标。分区组是美国调查局发布样本数据的最小地理单位(一个分区通常有600到3000人)。我们将其简称为“分区”。你的模型要利用这个数据进行学习,然后根据其它指标,预测任何分区的的房价中位数。1.1划定问题首先,你需要划定问题:监督或非监督,还是强化学习?这是个分类任务、回归任务,还是其它的?要使用批量学习还是线上学习?

2025-01-18 23:16:37 920

原创 基于机器学习随机森林算法的个人职业预测研究

1.背景调研随着信息技术的飞速发展,特别是大数据和云计算技术的广泛应用,各行各业都积累了大量的数据。这些数据中蕴含着丰富的信息和模式,为利用机器学习进行职业预测提供了可能。机器学习算法的不断进步,如深度学习、强化学习等,使得模型在处理复杂数据、挖掘潜在规律方面表现出色。全球化、技术革新和产业结构调整导致职业市场快速变化,新兴职业不断涌现,传统职业面临转型或消亡。求职者需要更准确地了解职业发展趋势,以便做出合理的职业规划;企业也需要有效预测人才需求,以优化招聘和人力资源配置。

2025-01-17 22:01:34 861

原创 当当网书籍信息爬虫

网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等,可以按照我们设置的规则自动化爬取网络上的信息,这些规则被称为爬虫算法。是一种自动化程序,用于从互联网上抓取数据。爬虫通过模拟浏览器的行为,访问网页并提取信息。这些信息可以是结构化的数据(如表格数据),也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。

2025-01-17 21:33:16 1857

原创 《王者荣耀》皮肤爬虫源码

【代码】《王者荣耀》皮肤爬虫源码。

2025-01-17 15:34:45 1055

原创 python密码学列置换加密解密程序

置换密码(Permutation Cipher)又叫换位密码(Transposi-tionCipher),它根据一定的规则重新排列明文,以便打破明文的结构特性。置换密码的特点是保持明文的所有字符不变,只是利用置换打乱了明文字符的位置和次序。最常见的置换密码有两种:1.列置换密码(明文P遵照密钥的规程按列换位并且按列读出序列得到密文C);2.周期置换密码(将明文P按固定长度m分组,然后对每组按1,2…,m的某个置换重排位置从而得到密文C)。

2025-01-16 23:22:34 469

原创 python农夫过河问题( Dijkstra算法实现)

在求解此问题过程中,我使⽤了Dijkstra算法来找到从起始状态到⽬标状态的最短路径。利⽤Dijkstra算法可以保证 在合法状态(狼不吃⽺、⽺不吃菜)下通过最少的步骤完成从起始状态到⽬标状态的任务。⾸先进⾏数学建模,将农夫、狼、⽺和菜的状态视作⼀个四元组(farmer, wolf, goat, cabbage),其中每个 元素的值为0或1,表⽰该物品是否在左边0或右边1。起始状态为(0, 0, 0, 0),⽬标状态为(1, 1, 1, 1),即所有物品都从左边移到右边。

2025-01-16 22:59:04 1105

原创 人民邮电出版社书籍信息爬虫

网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等,可以按照我们设置的规则自动化爬取网络上的信息,这些规则被称为爬虫算法。是一种自动化程序,用于从互联网上抓取数据。爬虫通过模拟浏览器的行为,访问网页并提取信息。这些信息可以是结构化的数据(如表格数据),也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。

2025-01-15 00:25:06 1284

原创 使用逻辑回归完成员工离职预测

该数据集来源于Kaggle竞赛平台,共计14999条样本和10个特征,本案例希望通过分析现有的员工离职数据,建立模型预测有可能离职的员 工。

2025-01-14 23:56:43 1050

原创 基于逻辑回归的银行客户流失预测研究

需要完整数据集加python代码,主页可下载摘要:当前大数据、人工智能、云计算等科技发展迅猛,互联网进一步崛起,尤其以支付宝、微信等移动支付工具为代表,科技与金融的结合以低成本、高效率的优势迅速渗透到整个银行业。传统银行在科技进步和产业升级的背景下面临越来越严峻的挑战,客户对于金融产品和服务的选择越来越多样化,商业银行原有的活期存款、理财产品、基金产品等业务不断流入互联网,传统商业银行利润被挤压,原有的优质客户大批流失。客户是商业银行生存的保障。

2025-01-13 14:18:31 1031

原创 python机器学习(葡萄酒质量数据分析报告)

该数据集包括红葡萄酒和白葡萄酒的质量评分,以及它们的多种化学特性。每个样本包含11个特征,如酒精含量、挥发性酸度、柠檬酸、残糖、氯化物、自由二氧化硫、总二氧化硫、密度、pH值、硫酸盐和酒精含量。这些特征可能会对葡萄酒的质量产生影响。(1)红葡萄酒:包含1599个样本。(2)白葡萄酒:包含4898个样本。目标是分析两类葡萄酒在质量上的差异,并探索哪些特征对质量评分影响最大。

2025-01-13 13:25:43 809

原创 python中国科学院院士图片+文本爬虫代码

4.数据存储,图片存储,注意保存图片格式,图片格式有png,jpg等格式,保存图片士注意要加入content,保证内容位图片二进制源码,否则会出现错误。图中a标签下img标签中src值位每位院士的图片地址,且该地址不完整,要对地址进行字符串拼接处理,同样要加入 加入。图中a标签中href值位每位院士的网页地址,且该地址不完整,要对地址进行字符串拼接处理加入。3.进入网页查看院士图片地址,与院士文本介绍内容,(利用re库解析网页)1.网页源码分析,判断网页是动态网页与静态网页(改网页位静态网页)

2025-01-12 15:25:42 1187

原创 python数值模拟银行排队问题

银行只有1个服务窗口,当顾客较多时,一部分顾客需要等待.假设。•每个顾客的服务时间服从均值10,方差4的正态分布.•顾客到来的时间服从参数为0.1的指数分布.•排队按照先到先服务的原则,每天工作8小时.模拟,该窗口中,每天的顾客平均等待时间.

2025-01-12 13:06:05 110

原创 机器学习学生的辍学和学业成功预测报告

在这个大数据时代,各种教育环境中产生了大量的数据,这些数据可以帮助我们运用机器学习技术,从中发现有价值的洞见。学生辍学预测是教育领域中的一个应用领域,机器学习算法可以被应用于预测哪些学生可能会辍学,通过从教育数据中提取有价值的模式和关 键参数。然而,算法的性能取决于我们输入的数据的质量。教育数据通常存在噪声,这会降低机器学习算法的性能,并需要准确的数据预处理。通过使用机器学习技术来预测学生辍学,可以帮助学校和教师及时发现可能会辍学的学生,采取相应的措施,从而降低学生辍学 率,提高教育质量。

2025-01-09 20:27:54 1032

原创 python期末必考10个经典实验题(含实验目的,实验内容)

1.使用蒙特·卡罗方法计算圆周率近似值2.使用枚举法验证6174猜想3.计算小明爬楼梯的爬法数量4.模拟决赛现场最终成绩计算过程5.模拟报数游戏(约瑟夫环问题)6.模拟轮盘抽奖游戏7.模拟蒙蒂霍尔悖论游戏8.抓狐狸游戏设计与实现9.模拟汉诺塔问题10.使用维吉尼亚密码算法实现加密和解密

2025-01-09 20:00:21 992

原创 Pandas数据分析之数据重塑(pivot与melt方法)

数据重塑是指转换一个数据表格的结构,使其适合做进一步数据分析,Pandas为用户提供了多种数据重塑方法,常用的有pivot和melt方法。

2025-01-06 16:38:21 460

原创 python书籍推荐《python数值计算与模拟》

书中有数值计算,常微分方程物理模拟,偏微分方程物理模拟,随机数模拟,背包问题,随机漫步模拟,自由落体运动模拟,飞船着陆模拟等,

2025-01-06 15:40:59 327

原创 python数据可视化之Pyecharts库使用

Pyecharts是一个基于 Python 的开源数据可视化库,它提供了一种简单而强大的方式来创建各种交互式图表。Pyecharts 是对流行的 JavaScript 数据可视化库 Echarts 的封装,使得在 Python 中使用 Echarts 变得更加方便和高效。特点和功能。

2025-01-05 15:55:10 929

原创 python期末考试必考40个基础编程题

该40个基础编程涉及领域广泛,适合各专业,金融,数学,算法,数据结构,可视化等多个领域,涵盖了pyth基础语法,列表操作,字符串操作,数据类型转换,循环结构,判断结构,函数定义,变量声明,class类编程等基础知识。运行代码无需环境配置,只要安装python成功,复制代码即可

2025-01-05 14:22:46 864

原创 机器学习人类发展世界指数数据集

人类发展指数(HDI)是一个总结性指标,衡量人类发展的关键维度的平均成就:长寿与健康、知识水平和体面的生活标准。HDI是三个维度的标准化指数的几何平均数。健康维度通过出生时的预期寿命进行评估,教育维度通过25岁及以上成年人的平均受教育年限以及入学年龄儿童的预期受教育年限进行衡量。生活标准维度通过人均国民总收入来衡量。HDI使用收入的对数,以反映随着人均国民收入的增加,收入的重要性递减。然后,将三个HDI维度指数的得分聚合成一个复合指数,使用几何平均数。有关更多详细信息,请参阅技术说明。

2025-01-04 16:26:18 305

原创 python随机抢红包模拟程序

利用random库编写随机抢红包程序,可从键盘上输入请输入红包总金额,红包个数,红包发放次数,统计n次抢红包手气王位于第几位。

2025-01-04 15:52:45 232

原创 Python高阶函数

2024-05-26 03:10:04 348

原创 利用matlab一张图画完高中常用函数图像

【代码】利用matlab一张图画完高中常用函数图像。

2023-04-08 00:37:01 386 1

原创 利用python绘制勾股定理赵爽弦图

赵爽弦图是数学中的一个经典图形,绘制赵爽图弦用到2个python自带库turtle和math。

2023-04-05 00:19:11 714 2

原创 MATLAB符号函数绘制各种函数图像,ezplot()函数 ezplot3()函数

ezplot()函数用于绘制显函数,隐函数,参数方程二维图像,函数格式ezplot(f)直接绘制图像ezplot(f,[min,max]) 指定函数x的值域范围。

2023-04-04 00:28:50 2389 2

转转图书信息爬取:网络爬虫的技术实现与案例分析

内容概要:本文介绍了基于Python开发的网络爬虫项目,针对转转平台书籍信息进行自动化采集。文中先阐述了基本概念和技术背景,涵盖请求发送、页面解析、数据存档全流程,并具体说明了如何构造网页爬虫来获取转转网指定分类下的图书详情,同时探讨爬虫设计时需要考虑的关键要素。通过实际编码操作展示了如何从网络接口获得Json数据流,再经由Json路径表达式提炼书籍条目属性字段,最终把这些信息导入Excel电子表格供离线审阅和进一步的数据挖掘。附有完整的Python源代码样例可供读者学习模仿。 适用人群:有兴趣了解Python爬虫编程初学者、有一定Web开发经验想要探索自动化数据收集技术的开发者以及需要大量图书资讯的研究员或者业务分析师。 使用场景及目标:本篇文章不仅提供关于构建一个小型爬虫应用的具体指导方针和支持参考资料,同时也意在引导读者思考API交互背后涉及的一系列技术挑战如反爬机制规避、高效数据抽取、稳定长连接管理等等,帮助其快速建立起完整且可行的实际项目方案以应对相似的问题情境。 其他说明:值得注意的是,为了尊重第三方服务平台的使用规定,在开展任何形式的数据搜集活动之前务必确保遵循相关法律规范和版权协议,并评估道德风险确保符合伦理标准。此外,由于Web架构频繁更新变化可能导致抓取脚本失效或效率下降的情况发生,请使用者定期维护和优化现有系统配置保证最佳性能表现。

2025-01-20

requests库转转图书爬虫代码

requests库转转图书爬虫代码

2025-01-20

python国产进口电影票房榜单数据可视化(可视化大屏)

python国产进口电影票房榜单数据可视化(可视化大屏)

2025-01-20

机器学习逻辑回归完成员工离职预测

机器学习逻辑回归完成员工离职预测

2025-01-15

基于逻辑回归的银行客户流失预测研究(数据集,代码,报告)

当前大数据、人工智能、云计算等科技发展迅猛,互联网进一步崛起,尤其以支付宝、微信等移动支付工具为代表,科技与金融的结合以低成本、高效率的优势迅速渗透到整个银行业。传统银行在科技进步和产业升级的背景下面临越来越严峻的挑战,客户对于金融产品和服务的选择越来越多样化,商业银行原有的活期存款、理财产品、基金产品等业务不断流入互联网,传统商业银行利润被挤压,原有的优质客户大批流失。客户是商业银行生存的保障。商业银行为了应对客户流失的现状,必然要与金融科技深度融合,通过金融科技对传统业务场景进行重塑,推动客户流失问题的缓解。基于以上情况,本文建立了Logistic回归模型并且进行了参数调优。在比较了准确率、精确率、召回率和AUC值等评价指标后,最终发现逻辑回归模型能较好的对银行客户流失进行预测。同时,本文还进一步对特征变量进行重要性排序,分析了客户流失的原因,相应的提出了一些挽留客户的策略建议,帮助银行有效地集中资源,在客户真正流失前做出更明智的挽留决策,提高绩效,保持持久的竞争力。

2025-01-13

葡萄酒质量数据分析报数据集

葡萄酒质量数据分析报数据集

2025-01-13

python中国科学院院士图片+文本爬虫代码

python中国科学院院士图片+文本爬虫代码

2025-01-12

python模拟随机红包发放程序

python模拟随机红包发放程序可设置红包金额,发放次数,红包个数,多次发放手气王计算。

2025-01-09

python数据分析与可视化ppt

Matplotlib库可视化库使用教程,含散点图,条形图,雷达图,等高线图,三维散点图,三位条形图等图形绘制,参数设置,标题设置,颜色设置,子图绘制,中文字体调整,图形格式调整等。

2025-01-09

python银行管理系统源码,下载可直接使用,含管理员登录,1.开户(1) ,2.查询(2) ,3.取款(3),4.存款(4), 5.转账(5)6.锁定(6),7.解锁(7),8.日志(8)等功能

python银行管理系统源码,无第三方库导入,所有函数均为定义函数,系统操作自动写入日志文件,支持管理员增,删,改,查等功能。

2025-01-09

河北日报网页数据爬虫程序

类编程爬虫程序,可设置爬取年份,月份,源码无配置,可直接使用,

2025-01-09

机器学习预测教育领域学生辍学与学业成功的数据分析及模型应用

内容概要:本文主要探讨了利用机器学习技术对学生辍学和学业成功进行预测的方法。通过分析一个详细的教育数据集,进行了数据清理与预处理,并利用了相关性分析来筛选数据。接着分别采用了随机森林、K近邻、逻辑回归以及决策树四种经典机器学习模型来进行实验,比较它们在该任务中的表现。最终得出逻辑回归模型与随机森林模型在这项工作中具有更好的性能。 适用人群:本报告适合关注教育领域的数据科学家、研究人员和教育工作者;对希望通过改进教学质量预防学生辍学者特别有价值。 使用场景及目标:该预测模型可以在学校管理过程中发挥作用,帮助识别潜在辍学风险高的学生,从而允许早期干预,优化教学资源配置并提升整体学业成功率。 其他说明:文中还讨论了一些重要的机器学习概念如准确性、错误率等,并引用了一系列与主题紧密关联的专业书籍和技术文献,为未来的研究提供了坚实的基础。

2025-01-09

教育数据科学中学生辍学预测与学业成功的机器学习方法

内容概要:本文探讨了利用机器学习预测学生辍学与学业成功的方法,涵盖了数据获取、预处理、相关性分析及多种模型的应用。首先介绍了在教育数据科学领域应用机器学习的价值,指出高质量数据对于提升模型性能的关键意义。随后,对数据集进行了详细解析,包含了教育背景、经济环境等多项社会特征变量,并针对数据中存在的噪声问题进行了清理和编码。接着,通过构建相关性热力图初步筛选变量,以减少不必要因素对模型的影响。之后,使用随机森林、K近邻、逻辑回归以及决策树四种经典算法建模,比较不同模型在准确性、精确率等方面的优劣。结果显示,随机森林和逻辑回归表现最佳。最后总结模型选择的原则,强调结合实际需求和数据特性优化模型的选择。 适合人群:本文面向从事数据科学研究的专业人士,尤其是对教育领域的数据分析感兴趣的科研工作者和技术开发者。 使用场景及目标:①帮助研究人员理解教育数据在机器学习模型构建中的全流程;②协助高校及培训机构提前识别潜在风险学生,制定针对性帮扶计划,促进教育公平性和效果。 阅读建议:对于初学者而言,应首先熟悉基础概念如随机森林、KNN等,再深入了解各个步骤背后的逻辑与操作细节。而对于有一定经验的学习者,则可重点关注实验部分及其结论讨论。同时,结合源代码深入理解和验证文中提出的观点。 其他说明:文末列举了一系列参考书籍和文献资料供有兴趣的读者进一步拓展阅读范围。此外还提供了Jupyter Notebook转HTML命令方便教学演示。

2025-01-09

Python选择题题库.doc

Python选择题题库.doc

2025-01-06

2023胡润百富榜-品牌榜数据集

字段说明: 排名:依据企业估值进行排序得到的排名 企业估值:单位为亿,人民币 企业信息:品牌名称 母公司:品牌所属的母公司 行业:品牌所属行业

2025-01-04

机器学习人类发展世界指数数据集

人类发展指数(HDI)是一个总结性指标,衡量人类发展的关键维度的平均成就:长寿与健康、知识水平和体面的生活标准。HDI是三个维度的标准化指数的几何平均数。健康维度通过出生时的预期寿命进行评估,教育维度通过25岁及以上成年人的平均受教育年限以及入学年龄儿童的预期受教育年限进行衡量。生活标准维度通过人均国民总收入来衡量。HDI使用收入的对数,以反映随着人均国民收入的增加,收入的重要性递减。然后,将三个HDI维度指数的得分聚合成一个复合指数,使用几何平均数。有关更多详细信息,请参阅技术说明。HDI可用于质疑国家政策选择,询问两个国民总收入相同的国家为何会出现不同的人类发展结果。这些对比可以激发关于政府政策优先事项的辩论。HDI简化并只捕捉了人类发展所涉及的部分内容。它没有反映不平等、贫困、人类安全、赋权等问题。人类发展报告办公室(HDRO)提供其他复合指数,作为人类发展、不平等、性别差距和贫困等一些关键问题的更广泛代理指标。要全面了解一个国家人类发展水平,还需要分析人类发展报告统计附录中呈现的其他指标和信息。

2025-01-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除