- 博客(204)
- 收藏
- 关注
原创 基于Flask的岗位就业可视化系统(总)
将清洗后的数据存储到sql中return time_str.format("年", "月", "日")# 连接数据库# 关闭数据库if cursor:if con:# 定义函数来执行单独一条sql语句return ressql = 'select count(岗位链接), round(avg(薪水), 2), ' \
2024-04-26 07:00:00 1574
原创 机器学习 —— 使用机器学习进行情感分析 详细介绍版
定义参数网格,用于网格搜索和交叉验证。参数网格中包含了多个参数的取值组合,通过尝试不同的组合来找到最佳的模型参数。具体参数含义如下:vect__ngram_range: [(1, 1)] 表示单词组合的范围为单个单词,不考虑多个单词的组合。vect__stop_words: [stop, None] 表示停用词列表的取值,包括使用预定义的停用词列表stop和不使用停用词列表。
2024-04-10 08:00:00 2635 2
原创 数据挖掘实战 —— 抖音用户浏览行为数据分析与挖掘(总)
本项目实现抖音用户浏览行为数据分析与挖掘。本次项通过数据挖掘技术对抖音用户的浏览行为数据进行分析和挖掘,以获得有价值的信息和洞察,并将其应用于实际场景中,如用户个性化推荐、内容优化和广告定向投放等。
2024-02-20 11:00:00 7809 8
原创 博客的简介(文章目录)
大家可以把这个当做目录,从中选择自己需要的内容进行阅览,欢迎大家一键三连!!!!话题讨论专栏点击进入话题讨论专栏主要文章:神奇的代码——可随意修改复制页面内容Python专栏点击进入Python专栏相关专栏软件测试专栏数据挖掘专栏主要文章:【python】习题 1-5周【python】习题 6-10周Anaconda下载安装与使用Jupyter Notebook的使用Pandas使用简介Numpy使用简介可视化工具使用简介软件测试专栏点击进入软件测试专栏。
2024-01-05 15:35:06 1533
原创 神奇的代码——可随意修改复制页面内容
需要注意的是,这段代码只能在支持JavaScript的浏览器中运行,并且需要具有足够的权限才能修改网页内容。进入开发者模式:在大多数浏览器中,你可以通过按下F12键或右键单击页面并选择"检查"来进入开发者模式。是一个JavaScript代码,用于将文档的模式设置为可编辑模式。这段代码是用于在网页中以可编辑模式打开原始页面的JavaScript代码。输入命令:在控制台中,你可以输入任何有效的JavaScript代码。这意味着你可以在控制台中直接编辑网页的内容,就像在Word文档中一样。
2023-12-20 14:55:38 3819
原创 python自动化测试实战 —— CSDN的Web页面自动化测试
CSDN(China Software Developer Network)是中国最大的IT社区和知识分享平台,提供了丰富的技术文章、博客、问答等内容,吸引了大量的开发者和技术爱好者。测试的目标是针对CSDN的Web页面进行功能和性能测试。CSDN首页页面:CSDN的首页是用户访问CSDN网站的入口页面,展示了最新的技术文章、博客、问答等内容。测试目标是验证CSDN首页页面是否成功加载,包括页面元素是否正确显示、数据是否正常加载等。
2023-12-14 08:00:00 1286
原创 大数据实战——基于Hadoop的Mapreduce编程实践案例的设计与实现
通过充分利用分布式计算,Hadoop实现了对大规模数据的高效处理,使得复杂的数据分析任务变得可管理和高效。通过这一实践案例,我们可以深入了解Hadoop的MapReduce编程模型,以及如何在实际应用中利用其优势来处理和分析海量数据。
2023-08-25 10:15:36 5786 3
原创 图的存储结构之打印邻接表
邻接表文章目录邻接表一、邻接表是什么?二、构建图的邻接表1.构建 图的邻接表 函数2.主函数(全代码)输入格式输入格式输入样例输出样例三、可运用邻接表的题目ag1:路径判断 (20 分)输入格式:输出格式:输入样例1输出样例1输入样例2输出样例2代码:(用DFS)ag2:最短路径 (20 分)输入格式:输出格式:输入样例1:输出样例1:输入样例2:输出样例2:代码:(用BFS)一、邻接表是什么?图的邻接表存储方法跟树的孩子链表示法相类似,是一种顺序分配和链式分配相结合的存储结构。如这个表头结点所
2021-05-28 12:30:14 734
原创 机器学习算法 —— 基于LDA手写数字分类
线性判别模型(LDA)在模式识别领域(比如人脸识别等图形图像识别领域)中有非常广泛的应用。LDA是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的。这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括,就是“投影后类内方差最小,类间方差最大”。我们要将数据在低维度上进行投影,投影后希望每一种类别数据的投影点尽可能的接近,而不同类别的数据的类别中心之间的距离尽可能的大。
2024-07-23 09:00:00 75
原创 机器学习算法 —— 线性判别模型(LDA)
线性判别模型(LDA)在模式识别领域(比如人脸识别等图形图像识别领域)中有非常广泛的应用。LDA是一种监督学习的降维技术,也就是说它的数据集的每个样本是有类别输出的。这点和PCA不同。PCA是不考虑样本类别输出的无监督降维技术。LDA的思想可以用一句话概括,就是“投影后类内方差最小,类间方差最大”。我们要将数据在低维度上进行投影,投影后希望每一种类别数据的投影点尽可能的接近,而不同类别的数据的类别中心之间的距离尽可能的大。
2024-07-23 07:00:00 294
原创 机器学习算法 —— 基于BP神经网络的乳腺癌分类
BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。
2024-07-16 10:00:00 77
原创 机器学习算法 —— BP神经网络
BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是一种按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。BP网络能学习和存贮大量的输入-输出模式映射关系,而无需事前揭示描述这种映射关系的数学方程。它的学习规则是使用最速下降法,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。BP神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer)。
2024-07-16 08:00:00 171
原创 机器学习算法 —— LightGBM
本次我们选择英雄联盟数据集进行LightGBM的场景体验。英雄联盟是2009年美国拳头游戏开发的MOBA竞技网游,在每局比赛中蓝队与红队在同一个地图进行作战,游戏的目标是破坏敌方队伍的防御塔,进而摧毁敌方的水晶枢纽,拿下比赛的胜利。现在共有9881场英雄联盟韩服钻石段位以上的排位比赛数据,数据提供了在十分钟时的游戏状态,包括击杀数、死亡数、金币数量、经验值、等级……参考项目:机器学习系列入门系列[七]:基于英雄联盟数据集的LightGBM的分类预测。
2024-07-09 08:00:00 373
原创 机器学习算法 —— XGBoost
首先需要导入一些基础的函数库包括:numpy (Python进行科学计算的基础软件包),pandas(pandas是一种快速,强大,灵活且易于使用的开源数据分析和处理工具),matplotlib和seaborn绘图。一种最简单的方法是把所有的相同类别的特征编码成同一个值,例如女=0,男=1,狗狗=2,所以最后编码的特征值是在[0,特征数量-1]这里我们采用网格调参,它的基本思想是穷举搜索:在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果。这个值也是用来避免过拟合的。
2024-07-09 07:00:00 275
原创 机器学习算法 —— 基于penguins_raw数据集的决策树
决策树是一种常见的分类模型,在金融风控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本能方法。例如在婚恋市场中,女方通常会先询问男方是否有房产,如果有房产再了解是否有车产,如果有车产再看是否有稳定工作……最后得出是否要深入了解的判断。
2024-07-02 08:00:00 79
原创 机器学习算法 —— 决策树
决策树是一种常见的分类模型,在金融风控、医疗辅助诊断等诸多行业具有较为广泛的应用。决策树的核心思想是基于树结构对数据进行划分,这种思想是人类处理问题时的本能方法。例如在婚恋市场中,女方通常会先询问男方是否有房产,如果有房产再了解是否有车产,如果有车产再看是否有稳定工作……最后得出是否要深入了解的判断。
2024-07-02 07:00:00 257
原创 机器学习算法 —— 基于支持向量机的分类预测
SVM优缺点优势:1、适用性广泛:SVM支持向量机在解决分类和回归问题上表现出色,可应用于各种数据类型和领域,例如文本分类、图像识别和生物信息学等。2、鲁棒性强:SVM支持向量机对于训练数据中的噪声和异常点具有一定的鲁棒性,可以有效地处理输入数据中的噪声。3、可避免陷入局部最优解:由于SVM支持向量机使用了结构风险最小化原则,它能够更好地避免陷入局部最优解,并且具有较低的泛化误差。
2024-06-25 08:00:00 65
原创 机器学习算法 —— 支持向量机
SVM优缺点优势:1、适用性广泛:SVM支持向量机在解决分类和回归问题上表现出色,可应用于各种数据类型和领域,例如文本分类、图像识别和生物信息学等。2、鲁棒性强:SVM支持向量机对于训练数据中的噪声和异常点具有一定的鲁棒性,可以有效地处理输入数据中的噪声。3、可避免陷入局部最优解:由于SVM支持向量机使用了结构风险最小化原则,它能够更好地避免陷入局部最优解,并且具有较低的泛化误差。
2024-06-25 07:00:00 234
原创 机器学习算法 —— K近邻(KNN回归)
k近邻方法是一种惰性学习算法,可以用于回归和分类,它的主要思想是投票机制,对于一个测试实例x, 我们在有标签的训练数据集上找到和最相近的k个数据,用他们的label进行投票,分类问题则进行表决投票,回归问题使用加权平均或者直接平均的方法。knn算法中我们最需要关注两个问题:k值的选择和距离的计算。kNN中的k是一个超参数,需要我们进行指定,一般情况下这个k和数据有很大关系,都是交叉验证进行选择,但是建议使用交叉验证的时候,k∈[2,20],使用交叉验证得到一个很好的k值。
2024-06-18 08:00:00 101
原创 机器学习算法 —— K近邻(KNN分类)
k近邻方法是一种惰性学习算法,可以用于回归和分类,它的主要思想是投票机制,对于一个测试实例x, 我们在有标签的训练数据集上找到和最相近的k个数据,用他们的label进行投票,分类问题则进行表决投票,回归问题使用加权平均或者直接平均的方法。knn算法中我们最需要关注两个问题:k值的选择和距离的计算。kNN中的k是一个超参数,需要我们进行指定,一般情况下这个k和数据有很大关系,都是交叉验证进行选择,但是建议使用交叉验证的时候,k∈[2,20],使用交叉验证得到一个很好的k值。
2024-06-18 07:00:00 205
原创 图书馆图书可视化分析+大屏
在数字化时代背景下,图书馆已经成为知识获取和共享的重要场所。然而,随着馆藏书籍数量的增加,如何高效管理和利用这些资源成为了图书馆管理者和用户面临的挑战。数据分析和可视化技术的引入为解决这一问题提供了新的途径。本文致力于通过数据分析技术和可视化手段,对图书馆书籍数据进行综合挖掘,希望通过图书分类、书籍价格及读者偏好等多维度信息,进而优化图书馆管理策略、指导书籍采购决策并提升读者服务质量。本文在数字化和信息化快速发展的背景下,图书馆如何利用数据分析与可视化方法来挖掘和优化书籍借阅数据。主要内容包括。
2024-06-17 08:00:00 1376
抖音用户浏览行为数据集
2024-02-15
Python文本数据分析所用数据压缩包
2023-12-14
基于聚类和回归分析方法探究蓝莓产量影响因素与预测模型研究数据集.zip
2024-06-02
基于数据挖掘与机器学习揭秘脱发主因之-脱发数据集
2024-05-12
多维因素与学生辍学风险预测数据集
2024-05-06
工业蒸汽量预测数据集.zip
2024-04-25
基于Flask的数据集.zip
2024-04-15
泰坦尼克号生存预测数据集.zip
2024-04-15
百货商场用户画像描述与价值分析数据集.zip
2024-04-14
运动员伤病预测数据集:injury-data.csv
2024-04-14
实习僧网站的实习岗位信息数据集.zip
2024-04-14
使用机器学习进行情感分析movie-data.csv
2024-04-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人