- 博客(32)
- 收藏
- 关注
![](https://csdnimg.cn/release/blogv2/dist/pc/img/listFixedTop.png)
原创 爬取豆瓣电影top前250的电影信息
豆瓣电影是一个汇集了大量电影信息和用户评价的平台,它为电影爱好者提供了一个发现、讨论和评价电影的社区。豆瓣电影的数据丰富,包括电影的基本信息(如名称、评分、导演、主演等)、用户评论、评分分布等,这些数据对于电影研究、市场分析以及个人兴趣探索都具有重要价值。制作思路爬虫通过模拟浏览器行为,向豆瓣电影服务器发送HTTP请求,获取网页内容。这一步需要设置合适的请求头,以模拟真实用户的浏览器访问,避免被网站的反爬机制识别。获得网页的HTML内容后,爬虫需要从这些内容中提取出有用的数据。
2025-01-15 00:18:47
1907
原创 99%的人都不知道辗转相除法求最大公约数
辗转相除法,也称为欧几里得算法,是一种高效的计算两个非负整数最大公约数(GCD)的方法。这种方法基于一个原理:两个整数的最大公约数不变,即使其中一个数加上另一个数的倍数。具体的计算过程是通过不断进行除法运算,直到余数为0,此时的除数就是这两个数的最大公约数。
2025-01-22 18:17:24
187
原创 python解奥赛运算题
有一个以文字代替数字的算术表达式如下图所示,已知4个替代数字的文字中没有重复,编写程序求出文字所替代的数字。按逻辑思维:如果3位数和3位数相加等于4位数,则“青”只能是1:“山”+“青”大于等于10,因此“山”只能是9,得出“龙”是0:个位的两个“山”相加,推得“外”等于8。而按计算思维,则注重于程序的实现,用穷举法设计嵌套的4层循环,把所有的数字都试一遍,找出4个数字不相互重复的合满足加法等式条件。
2025-01-22 18:02:58
368
原创 python麻辣香锅菜品推荐
推荐算法出现得很早,最早的推荐系统是卡耐基·梅隆大学推出的Web Watcher浏览器导航系统,可以根据当的搜索目标和用户信息,突出显示对用户有用的超链接。斯坦福大学则推出了个性化推荐系统LIRA.AT&T实验室于1997年提出基于协作过滤的个性化推荐系统,通过了解用户的喜好和需求,能更精确地呈现相关内容。在Facebook自2006年开始引领互联网社交新潮流之后,推荐系统真正与互联网产品相结合。
2025-01-21 22:17:25
412
原创 python高级加密算法AES对信息进行加密和解密
(高级加密标准)是一种广泛使用的对称加密算法,它以字节为单位处理数据,将明文分组加密成密文。AES算法的核心在于一个轮函数,该函数会对数据执行多次变换,包括字节代换、行移位、列混合和轮密钥加。这些操作确保了数据的安全性,使得原始数据经过AES加密后变得无法识别。
2025-01-21 16:31:39
968
原创 python转转商超书籍信息爬虫
网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等,可以按照我们设置的规则自动化爬取网络上的信息,这些规则被称为爬虫算法。是一种自动化程序,用于从互联网上抓取数据。爬虫通过模拟浏览器的行为,访问网页并提取信息。这些信息可以是结构化的数据(如表格数据),也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。
2025-01-20 22:58:50
1628
原创 机器学习皮马印第安人糖尿病数据集预测报告
本研究在充分调研的前提下,利用皮马印第安人糖尿病数据集,利用Python中的随机森林、决策树、逻辑回归等多种机器学习算法,构建起糖尿病风险预警系统,用户可将自身信息输入到系统中,系统会自动分析是否具有糖尿病的风险,为用户和医生进行健康筛查提供帮助。充分调研的前提下,利用皮马印第安人糖尿病数据集,利用Python中的随机森林、决策树、逻辑回归等多种机器学习算法,构建起糖尿病风险预警系统,用户可将自身信息输入到系统中,系统会自动分析是否具有糖尿病的风险,为用户和医生进行健康筛查提供帮助。由于数据集较小,共有。
2025-01-18 23:50:55
883
原创 机器学习加州房价预测模型报告
任务是利用加州普查数据,建立一个加州房价模型。这个数据包含每个分区组的人口、收入中位数、房价中位数等指标。分区组是美国调查局发布样本数据的最小地理单位(一个分区通常有600到3000人)。我们将其简称为“分区”。你的模型要利用这个数据进行学习,然后根据其它指标,预测任何分区的的房价中位数。1.1划定问题首先,你需要划定问题:监督或非监督,还是强化学习?这是个分类任务、回归任务,还是其它的?要使用批量学习还是线上学习?
2025-01-18 23:16:37
920
原创 基于机器学习随机森林算法的个人职业预测研究
1.背景调研随着信息技术的飞速发展,特别是大数据和云计算技术的广泛应用,各行各业都积累了大量的数据。这些数据中蕴含着丰富的信息和模式,为利用机器学习进行职业预测提供了可能。机器学习算法的不断进步,如深度学习、强化学习等,使得模型在处理复杂数据、挖掘潜在规律方面表现出色。全球化、技术革新和产业结构调整导致职业市场快速变化,新兴职业不断涌现,传统职业面临转型或消亡。求职者需要更准确地了解职业发展趋势,以便做出合理的职业规划;企业也需要有效预测人才需求,以优化招聘和人力资源配置。
2025-01-17 22:01:34
861
原创 当当网书籍信息爬虫
网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等,可以按照我们设置的规则自动化爬取网络上的信息,这些规则被称为爬虫算法。是一种自动化程序,用于从互联网上抓取数据。爬虫通过模拟浏览器的行为,访问网页并提取信息。这些信息可以是结构化的数据(如表格数据),也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。
2025-01-17 21:33:16
1857
原创 python密码学列置换加密解密程序
置换密码(Permutation Cipher)又叫换位密码(Transposi-tionCipher),它根据一定的规则重新排列明文,以便打破明文的结构特性。置换密码的特点是保持明文的所有字符不变,只是利用置换打乱了明文字符的位置和次序。最常见的置换密码有两种:1.列置换密码(明文P遵照密钥的规程按列换位并且按列读出序列得到密文C);2.周期置换密码(将明文P按固定长度m分组,然后对每组按1,2…,m的某个置换重排位置从而得到密文C)。
2025-01-16 23:22:34
469
原创 python农夫过河问题( Dijkstra算法实现)
在求解此问题过程中,我使⽤了Dijkstra算法来找到从起始状态到⽬标状态的最短路径。利⽤Dijkstra算法可以保证 在合法状态(狼不吃⽺、⽺不吃菜)下通过最少的步骤完成从起始状态到⽬标状态的任务。⾸先进⾏数学建模,将农夫、狼、⽺和菜的状态视作⼀个四元组(farmer, wolf, goat, cabbage),其中每个 元素的值为0或1,表⽰该物品是否在左边0或右边1。起始状态为(0, 0, 0, 0),⽬标状态为(1, 1, 1, 1),即所有物品都从左边移到右边。
2025-01-16 22:59:04
1105
原创 人民邮电出版社书籍信息爬虫
网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等,可以按照我们设置的规则自动化爬取网络上的信息,这些规则被称为爬虫算法。是一种自动化程序,用于从互联网上抓取数据。爬虫通过模拟浏览器的行为,访问网页并提取信息。这些信息可以是结构化的数据(如表格数据),也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。
2025-01-15 00:25:06
1284
原创 使用逻辑回归完成员工离职预测
该数据集来源于Kaggle竞赛平台,共计14999条样本和10个特征,本案例希望通过分析现有的员工离职数据,建立模型预测有可能离职的员 工。
2025-01-14 23:56:43
1050
原创 基于逻辑回归的银行客户流失预测研究
需要完整数据集加python代码,主页可下载摘要:当前大数据、人工智能、云计算等科技发展迅猛,互联网进一步崛起,尤其以支付宝、微信等移动支付工具为代表,科技与金融的结合以低成本、高效率的优势迅速渗透到整个银行业。传统银行在科技进步和产业升级的背景下面临越来越严峻的挑战,客户对于金融产品和服务的选择越来越多样化,商业银行原有的活期存款、理财产品、基金产品等业务不断流入互联网,传统商业银行利润被挤压,原有的优质客户大批流失。客户是商业银行生存的保障。
2025-01-13 14:18:31
1031
原创 python机器学习(葡萄酒质量数据分析报告)
该数据集包括红葡萄酒和白葡萄酒的质量评分,以及它们的多种化学特性。每个样本包含11个特征,如酒精含量、挥发性酸度、柠檬酸、残糖、氯化物、自由二氧化硫、总二氧化硫、密度、pH值、硫酸盐和酒精含量。这些特征可能会对葡萄酒的质量产生影响。(1)红葡萄酒:包含1599个样本。(2)白葡萄酒:包含4898个样本。目标是分析两类葡萄酒在质量上的差异,并探索哪些特征对质量评分影响最大。
2025-01-13 13:25:43
809
原创 python中国科学院院士图片+文本爬虫代码
4.数据存储,图片存储,注意保存图片格式,图片格式有png,jpg等格式,保存图片士注意要加入content,保证内容位图片二进制源码,否则会出现错误。图中a标签下img标签中src值位每位院士的图片地址,且该地址不完整,要对地址进行字符串拼接处理,同样要加入 加入。图中a标签中href值位每位院士的网页地址,且该地址不完整,要对地址进行字符串拼接处理加入。3.进入网页查看院士图片地址,与院士文本介绍内容,(利用re库解析网页)1.网页源码分析,判断网页是动态网页与静态网页(改网页位静态网页)
2025-01-12 15:25:42
1187
原创 python数值模拟银行排队问题
银行只有1个服务窗口,当顾客较多时,一部分顾客需要等待.假设。•每个顾客的服务时间服从均值10,方差4的正态分布.•顾客到来的时间服从参数为0.1的指数分布.•排队按照先到先服务的原则,每天工作8小时.模拟,该窗口中,每天的顾客平均等待时间.
2025-01-12 13:06:05
110
原创 机器学习学生的辍学和学业成功预测报告
在这个大数据时代,各种教育环境中产生了大量的数据,这些数据可以帮助我们运用机器学习技术,从中发现有价值的洞见。学生辍学预测是教育领域中的一个应用领域,机器学习算法可以被应用于预测哪些学生可能会辍学,通过从教育数据中提取有价值的模式和关 键参数。然而,算法的性能取决于我们输入的数据的质量。教育数据通常存在噪声,这会降低机器学习算法的性能,并需要准确的数据预处理。通过使用机器学习技术来预测学生辍学,可以帮助学校和教师及时发现可能会辍学的学生,采取相应的措施,从而降低学生辍学 率,提高教育质量。
2025-01-09 20:27:54
1032
原创 python期末必考10个经典实验题(含实验目的,实验内容)
1.使用蒙特·卡罗方法计算圆周率近似值2.使用枚举法验证6174猜想3.计算小明爬楼梯的爬法数量4.模拟决赛现场最终成绩计算过程5.模拟报数游戏(约瑟夫环问题)6.模拟轮盘抽奖游戏7.模拟蒙蒂霍尔悖论游戏8.抓狐狸游戏设计与实现9.模拟汉诺塔问题10.使用维吉尼亚密码算法实现加密和解密
2025-01-09 20:00:21
992
原创 Pandas数据分析之数据重塑(pivot与melt方法)
数据重塑是指转换一个数据表格的结构,使其适合做进一步数据分析,Pandas为用户提供了多种数据重塑方法,常用的有pivot和melt方法。
2025-01-06 16:38:21
460
原创 python书籍推荐《python数值计算与模拟》
书中有数值计算,常微分方程物理模拟,偏微分方程物理模拟,随机数模拟,背包问题,随机漫步模拟,自由落体运动模拟,飞船着陆模拟等,
2025-01-06 15:40:59
327
原创 python数据可视化之Pyecharts库使用
Pyecharts是一个基于 Python 的开源数据可视化库,它提供了一种简单而强大的方式来创建各种交互式图表。Pyecharts 是对流行的 JavaScript 数据可视化库 Echarts 的封装,使得在 Python 中使用 Echarts 变得更加方便和高效。特点和功能。
2025-01-05 15:55:10
929
原创 python期末考试必考40个基础编程题
该40个基础编程涉及领域广泛,适合各专业,金融,数学,算法,数据结构,可视化等多个领域,涵盖了pyth基础语法,列表操作,字符串操作,数据类型转换,循环结构,判断结构,函数定义,变量声明,class类编程等基础知识。运行代码无需环境配置,只要安装python成功,复制代码即可
2025-01-05 14:22:46
864
原创 机器学习人类发展世界指数数据集
人类发展指数(HDI)是一个总结性指标,衡量人类发展的关键维度的平均成就:长寿与健康、知识水平和体面的生活标准。HDI是三个维度的标准化指数的几何平均数。健康维度通过出生时的预期寿命进行评估,教育维度通过25岁及以上成年人的平均受教育年限以及入学年龄儿童的预期受教育年限进行衡量。生活标准维度通过人均国民总收入来衡量。HDI使用收入的对数,以反映随着人均国民收入的增加,收入的重要性递减。然后,将三个HDI维度指数的得分聚合成一个复合指数,使用几何平均数。有关更多详细信息,请参阅技术说明。
2025-01-04 16:26:18
305
原创 python随机抢红包模拟程序
利用random库编写随机抢红包程序,可从键盘上输入请输入红包总金额,红包个数,红包发放次数,统计n次抢红包手气王位于第几位。
2025-01-04 15:52:45
232
原创 MATLAB符号函数绘制各种函数图像,ezplot()函数 ezplot3()函数
ezplot()函数用于绘制显函数,隐函数,参数方程二维图像,函数格式ezplot(f)直接绘制图像ezplot(f,[min,max]) 指定函数x的值域范围。
2023-04-04 00:28:50
2389
2
转转图书信息爬取:网络爬虫的技术实现与案例分析
2025-01-20
基于逻辑回归的银行客户流失预测研究(数据集,代码,报告)
2025-01-13
python数据分析与可视化ppt
2025-01-09
python银行管理系统源码,下载可直接使用,含管理员登录,1.开户(1) ,2.查询(2) ,3.取款(3),4.存款(4), 5.转账(5)6.锁定(6),7.解锁(7),8.日志(8)等功能
2025-01-09
机器学习预测教育领域学生辍学与学业成功的数据分析及模型应用
2025-01-09
教育数据科学中学生辍学预测与学业成功的机器学习方法
2025-01-09
机器学习人类发展世界指数数据集
2025-01-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人