- 博客(161)
- 收藏
- 关注
原创 基于Flask的岗位就业可视化系统(总)
将清洗后的数据存储到sql中return time_str.format("年", "月", "日")# 连接数据库# 关闭数据库if cursor:if con:# 定义函数来执行单独一条sql语句return ressql = 'select count(岗位链接), round(avg(薪水), 2), ' \
2024-04-26 07:00:00 1422
原创 机器学习 —— 使用机器学习进行情感分析 详细介绍版
定义参数网格,用于网格搜索和交叉验证。参数网格中包含了多个参数的取值组合,通过尝试不同的组合来找到最佳的模型参数。具体参数含义如下:vect__ngram_range: [(1, 1)] 表示单词组合的范围为单个单词,不考虑多个单词的组合。vect__stop_words: [stop, None] 表示停用词列表的取值,包括使用预定义的停用词列表stop和不使用停用词列表。
2024-04-10 08:00:00 1496 2
原创 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(总)
本项目实现抖音用户浏览行为数据分析与挖掘。本次项通过数据挖掘技术对抖音用户的浏览行为数据进行分析和挖掘,以获得有价值的信息和洞察,并将其应用于实际场景中,如用户个性化推荐、内容优化和广告定向投放等。
2024-02-20 11:00:00 3713
原创 博客的简介(文章目录)
大家可以把这个当做目录,从中选择自己需要的内容进行阅览,欢迎大家一键三连!!!!话题讨论专栏点击进入话题讨论专栏主要文章:神奇的代码——可随意修改复制页面内容Python专栏点击进入Python专栏相关专栏软件测试专栏数据挖掘专栏主要文章:【python】习题 1-5周【python】习题 6-10周Anaconda下载安装与使用Jupyter Notebook的使用Pandas使用简介Numpy使用简介可视化工具使用简介软件测试专栏点击进入软件测试专栏。
2024-01-05 15:35:06 1028
原创 神奇的代码——可随意修改复制页面内容
需要注意的是,这段代码只能在支持JavaScript的浏览器中运行,并且需要具有足够的权限才能修改网页内容。进入开发者模式:在大多数浏览器中,你可以通过按下F12键或右键单击页面并选择"检查"来进入开发者模式。是一个JavaScript代码,用于将文档的模式设置为可编辑模式。这段代码是用于在网页中以可编辑模式打开原始页面的JavaScript代码。输入命令:在控制台中,你可以输入任何有效的JavaScript代码。这意味着你可以在控制台中直接编辑网页的内容,就像在Word文档中一样。
2023-12-20 14:55:38 1301
原创 python自动化测试实战 —— CSDN的Web页面自动化测试
CSDN(China Software Developer Network)是中国最大的IT社区和知识分享平台,提供了丰富的技术文章、博客、问答等内容,吸引了大量的开发者和技术爱好者。测试的目标是针对CSDN的Web页面进行功能和性能测试。CSDN首页页面:CSDN的首页是用户访问CSDN网站的入口页面,展示了最新的技术文章、博客、问答等内容。测试目标是验证CSDN首页页面是否成功加载,包括页面元素是否正确显示、数据是否正常加载等。
2023-12-14 08:00:00 988
原创 大数据实战——基于Hadoop的Mapreduce编程实践案例的设计与实现
通过充分利用分布式计算,Hadoop实现了对大规模数据的高效处理,使得复杂的数据分析任务变得可管理和高效。通过这一实践案例,我们可以深入了解Hadoop的MapReduce编程模型,以及如何在实际应用中利用其优势来处理和分析海量数据。
2023-08-25 10:15:36 2960 2
原创 图的存储结构之打印邻接表
邻接表文章目录邻接表一、邻接表是什么?二、构建图的邻接表1.构建 图的邻接表 函数2.主函数(全代码)输入格式输入格式输入样例输出样例三、可运用邻接表的题目ag1:路径判断 (20 分)输入格式:输出格式:输入样例1输出样例1输入样例2输出样例2代码:(用DFS)ag2:最短路径 (20 分)输入格式:输出格式:输入样例1:输出样例1:输入样例2:输出样例2:代码:(用BFS)一、邻接表是什么?图的邻接表存储方法跟树的孩子链表示法相类似,是一种顺序分配和链式分配相结合的存储结构。如这个表头结点所
2021-05-28 12:30:14 610
翻译 数据可视化在图书馆中的应用及发展趋势
为说明数据可视化在图书馆的应用实践,以CNKI期刊数据库收录的期刊论文为研究对象,运用Excel 2016数据统计软件和VOSviewer1.6 . 19等可视化分析软件。将数据可视化在图书馆应用的研究成果分为4个阶段对研究热点和趋势进行可视化分析。图书馆行业数据可视化应用的研究重点逐渐从数据分析转向数据服务。随着社交媒体的广泛使用,图书馆比以往更加重视用户数据素养的培养、知识服务的数字化、信息一目了然的可视化、数字人文的研究等。
2024-05-22 11:47:47 10
原创 基于数据挖掘与机器学习揭秘脱发主因
在本次研究中,我们采用了数据可视化和统计分析的方法,对影响脱发的各种因素进行了详尽的探索性分析。为了更准确地理解这些因素与脱发之间的关联,我们还构建了逻辑回归模型和随机森林模型。以下是我们通过这些方法得出的主要结论:1. 年龄是影响脱发的一个关键因素,特别是在18至50岁这个年龄段。在这个年龄范围内,20岁左右、38岁左右以及接近50岁的人群中,脱发现象更为常见。此外,那些有不良护发习惯的人略少于没有不良护发习惯的人。同时,认为自己处于可能导致脱发的环境中的人数略高于不认为自己处于此类环境的人数。
2024-05-13 07:00:00 824
原创 多维因素与学生辍学风险预测附录
在构建数据模型时,我们可以引入以下标签进行相关性分析和预测:(将学业状态,是否为奖学金,学业成绩获得者作为标签,进行相关性分析与预测。学业状态:这一标签反映了学生的当前教育阶段,如是否在校、休学、毕业等。通过分析这一标签与其他变量的关系,我们可以识别可能导致学生辍学的风险因素,从而提前采取干预措施,如提供辅导和心理支持,以降低辍学率。奖学金获得者:这一标签指示学生是否获得奖学金。
2024-05-07 08:00:00 987
原创 多维因素与学生辍学风险预测
本项目系统研究了学生学业数据,并研究影响辍学的关键因素、对地区情况进行分析,最终对辍学的发生进行预测。识别学生辍学的风险因素:提前去进行指导教育,降低辍学率发掘影响成绩的因素:对症下药,提高学习成绩不同地区社会因素对居民的影响:帮助社会机构可以制定帮助读书、就业的具体举措因为时间有限还有诸多可优化之处,还请多多包涵。
2024-05-07 07:00:00 1801
原创 机器学习实战 —— 工业蒸汽量预测(总)
燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。数据分析:查看变量间相关性以及找出关键变量。数据特征工程对数据精进:异常值处理、归一化处理以及特征降维。模型训练(涉及主流ML模型):决策树、随机森林,lightgbm等。模型验证:评估指标以及交叉验证等。特征优化:用lgb对特征进行优化。模型融合:进行基于stacking方式模型融合。
2024-05-06 07:00:00 1170
原创 机器学习实战 —— 工业蒸汽量预测(六)
燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。数据分析:查看变量间相关性以及找出关键变量。数据特征工程对数据精进:异常值处理、归一化处理以及特征降维。模型训练(涉及主流ML模型):决策树、随机森林,lightgbm等。模型验证:评估指标以及交叉验证等。特征优化:用lgb对特征进行优化。模型融合:进行基于stacking方式模型融合。
2024-05-05 07:00:00 1205
原创 机器学习实战 —— 工业蒸汽量预测(五)
燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。数据分析:查看变量间相关性以及找出关键变量。数据特征工程对数据精进:异常值处理、归一化处理以及特征降维。模型训练(涉及主流ML模型):决策树、随机森林,lightgbm等。模型验证:评估指标以及交叉验证等。特征优化:用lgb对特征进行优化。模型融合:进行基于stacking方式模型融合。
2024-05-04 07:00:00 1140
原创 机器学习实战 —— 工业蒸汽量预测(四)
燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。数据分析:查看变量间相关性以及找出关键变量。数据特征工程对数据精进:异常值处理、归一化处理以及特征降维。模型训练(涉及主流ML模型):决策树、随机森林,lightgbm等。模型验证:评估指标以及交叉验证等。特征优化:用lgb对特征进行优化。模型融合:进行基于stacking方式模型融合。
2024-05-03 07:00:00 901
原创 机器学习实战 —— 工业蒸汽量预测(三)
燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。数据分析:查看变量间相关性以及找出关键变量。数据特征工程对数据精进:异常值处理、归一化处理以及特征降维。模型训练(涉及主流ML模型):决策树、随机森林,lightgbm等。模型验证:评估指标以及交叉验证等。特征优化:用lgb对特征进行优化。模型融合:进行基于stacking方式模型融合。
2024-05-02 07:00:00 810
原创 机器学习实战 —— 工业蒸汽量预测(二)
燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。数据分析:查看变量间相关性以及找出关键变量。数据特征工程对数据精进:异常值处理、归一化处理以及特征降维。模型训练(涉及主流ML模型):决策树、随机森林,lightgbm等。模型验证:评估指标以及交叉验证等。特征优化:用lgb对特征进行优化。模型融合:进行基于stacking方式模型融合。
2024-05-01 07:00:00 947
原创 机器学习实战 —— 工业蒸汽量预测(一)
燃料在燃烧时加热水生成蒸汽,蒸汽压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温高压蒸汽。数据分析:查看变量间相关性以及找出关键变量。数据特征工程对数据精进:异常值处理、归一化处理以及特征降维。模型训练(涉及主流ML模型):决策树、随机森林,lightgbm等。模型验证:评估指标以及交叉验证等。特征优化:用lgb对特征进行优化。模型融合:进行基于stacking方式模型融合。
2024-04-30 15:52:19 1000
原创 泰坦尼克号乘客生存情况预测分析总
Titanic数据集在数据分析领域是十分经典的数据集,非常适合刚入门的小伙伴进行学习!泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在船上的 2224 名乘客和机组人员中,共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会,从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管在沉船事件中幸存者有一些运气因素,但有些人比其他人更容易存活下来,究竟有哪些因素影响着最终乘客的生存与否呢?
2024-04-28 07:00:00 1124
原创 泰坦尼克号乘客生存情况预测分析3
Titanic数据集在数据分析领域是十分经典的数据集,非常适合刚入门的小伙伴进行学习!泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在船上的 2224 名乘客和机组人员中,共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会,从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管在沉船事件中幸存者有一些运气因素,但有些人比其他人更容易存活下来,究竟有哪些因素影响着最终乘客的生存与否呢?
2024-04-28 06:00:00 545
原创 泰坦尼克号乘客生存情况预测分析2
Titanic数据集在数据分析领域是十分经典的数据集,非常适合刚入门的小伙伴进行学习!泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在船上的 2224 名乘客和机组人员中,共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会,从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管在沉船事件中幸存者有一些运气因素,但有些人比其他人更容易存活下来,究竟有哪些因素影响着最终乘客的生存与否呢?
2024-04-27 07:00:00 873 4
原创 泰坦尼克号乘客生存情况预测分析1
Titanic数据集在数据分析领域是十分经典的数据集,非常适合刚入门的小伙伴进行学习!泰坦尼克号轮船的沉没是历史上最为人熟知的海难事件之一。1912年4月15日,在她的处女航中,泰坦尼克号在与冰山相撞后沉没,在船上的 2224 名乘客和机组人员中,共造成 1502 人死亡。这场耸人听闻的悲剧震惊了国际社会,从而促进了船舶安全规定的完善。造成海难失事的原因之一是乘客和机组人员没有足够的救生艇。尽管在沉船事件中幸存者有一些运气因素,但有些人比其他人更容易存活下来,究竟有哪些因素影响着最终乘客的生存与否呢?
2024-04-27 06:00:00 663
原创 基于Flask的岗位就业可视化系统(py版本介绍)
你将会学到1 Python爬虫:盗亦有道,掌握requests和xpath的相关用法。2 数据清洗:能详细知道项目中数据预处理的步骤,包括去重去缺失值、变量重编码、特征字段创造和文本数据预处理,玩转pandas、numpy相关用法。3 数据库知识:select、insert等操作,掌握pymysql相关用法。4 前后端知识:了解到HTML、JQuery、JavaScript、Ajax的相关用法。5 Flask知识:能快速建立起一个轻量级的Web框架,利用Python实现前后端交互。
2024-04-26 07:15:00 718
原创 基于Flask的岗位就业可视化系统(四)
本项目综合了基本数据分析的流程,包括数据采集(爬虫)、数据清洗、数据存储、数据前后端可视化等推荐阅读顺序为:数据采集——>数据清洗——>数据库存储——>基于Flask的前后端交互,有问题的话可以留言,有时间我会解疑~
2024-04-25 07:30:00 1069
原创 基于Flask的岗位就业可视化系统(三)
本项目综合了基本数据分析的流程,包括数据采集(爬虫)、数据清洗、数据存储、数据前后端可视化等推荐阅读顺序为:数据采集——>数据清洗——>数据库存储——>基于Flask的前后端交互,有问题的话可以留言,有时间我会解疑~
2024-04-25 07:00:00 1690
原创 基于Flask的岗位就业可视化系统(二)
本项目综合了基本数据分析的流程,包括数据采集(爬虫)、数据清洗、数据存储、数据前后端可视化等推荐阅读顺序为:数据采集——>数据清洗——>数据库存储——>基于Flask的前后端交互,有问题的话可以留言,有时间我会解疑~
2024-04-24 14:49:10 669
原创 基于Flask的岗位就业可视化系统(一)
本项目综合了基本数据分析的流程,包括数据采集(爬虫)、数据清洗、数据存储、数据前后端可视化等推荐阅读顺序为:数据采集——>数据清洗——>数据库存储——>基于Flask的前后端交互,有问题的话可以留言,有时间我会解疑~
2024-04-24 14:48:57 1900
原创 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(续)
本项目实现抖音用户浏览行为数据分析与挖掘。抖音是一款流行的短视频平台,用户在使用抖音时会产生大量的浏览行为数据,包括用户的观看视频、点赞、评论、分享等行为。本次项通过数据挖掘技术对抖音用户的浏览行为数据进行分析和挖掘,以获得有价值的信息和洞察,并将其应用于实际场景中,如用户个性化推荐、内容优化和广告定向投放等。
2024-04-22 08:00:00 1078 1
原创 成为程序员后你都明白了什么?
最初,我对编程语言和算法等基础知识了解甚少,但随着时间的推移,我逐渐掌握了多种编程语言,例如Python、Java和C++等。我意识到,作为一名程序员,我不仅仅是编写代码的工具,而是一个解决问题的专家。我需要具备良好的逻辑思维能力和问题解决能力,能够分析和理解复杂的业务需求,并提供有效的解决方案。总结起来,成为程序员后,我在技术上取得了成长和突破,对职业价值有了更深入的认识,体验到了工作中的挑战和成就感。我也学会了如何制定合理的工作计划和时间管理,以提高团队的效率和产出。成为程序员后,我明白了许多事情。
2024-04-18 21:38:58 373 1
原创 Python爬取猫眼电影票房 + 数据可视化
通过造一个content字符串,包含请求方法、时间戳、User-Agent、index等信息,并对其进行MD5加密得到sign。接着我们就可以对于猫眼电影票房数据进行爬取了,比如上座率、场均人次、票房占比、电影名称、上映时间、综合票房、排片场次和排片占比等。接着我们想要进行数据抓包,就要看网站的具体内容,通过按F12,我们可以看到详细信息。所以我们需要对User-Agent与signKey分别进行解密。通过DataFrame输出到控制台我们可以看到爬取成功。对猫眼电影票房进行爬取,首先我们打开。
2024-04-18 07:00:00 1371 4
原创 百货商场用户画像描绘与价值分析附录
本项目内容主要是基于Python的“百货商场用户画像描述与价值分析”,里面有详细的数据预处理、数据可视化和数据建模等步骤。同时,针对传统RFM模型进行了改进,构造了LRFMP模型来分析客户价值,挖掘客户价值的八个字段,并通过WordCloud形式展现了出来,可以对会员用户进行精准画像。
2024-04-17 08:00:00 841
原创 百货商场用户画像描绘与价值分析
本项目内容主要是基于Python的“百货商场用户画像描述与价值分析”,里面有详细的数据预处理、数据可视化和数据建模等步骤。同时,针对传统RFM模型进行了改进,构造了LRFMP模型来分析客户价值,挖掘客户价值的八个字段,并通过WordCloud形式展现了出来,可以对会员用户进行精准画像。
2024-04-17 07:00:00 1414
原创 淘宝天猫玩具销售数据可视化
淘宝销售乐高商品的店铺及其乐高产品、销量的信息进行分析数据集包括销售乐高的店铺信息、乐高的种类产品、销售省份等淘宝、天猫。
2024-04-16 10:00:00 874
Python文本数据分析所用数据压缩包
2023-12-14
自动化测试学习源码.rar
2023-12-06
基于数据挖掘与机器学习揭秘脱发主因之-脱发数据集
2024-05-12
多维因素与学生辍学风险预测数据集
2024-05-06
工业蒸汽量预测数据集.zip
2024-04-25
基于Flask的数据集.zip
2024-04-15
泰坦尼克号生存预测数据集.zip
2024-04-15
百货商场用户画像描述与价值分析数据集.zip
2024-04-14
运动员伤病预测数据集:injury-data.csv
2024-04-14
实习僧网站的实习岗位信息数据集.zip
2024-04-14
使用机器学习进行情感分析movie-data.csv
2024-04-01
抖音用户浏览行为数据集
2024-02-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人