- 博客(14)
- 收藏
- 关注
原创 大数据技术基础综述
大数据时代的来临,带来了信息技术发展的巨大变革,在金融、汽车、零售、餐饮、电信、能源、医疗等社会各行各业都有大数据的身影。大数据技术深刻影响着社会生产和人民生活。世界主要国家高度重视大数据发展,我国也将发展大数据作为国家战略。当谈及大数据时,往往并非仅指数据本身,而是数据和大数据技术二者的综合。大数据的特点可以从四个方面概括为数据量大、数据种类繁多、处理速度快、价值密度低。而如何对大数据进行采集、存储、管理、分析、计算以及可视化的大数据技术也随着数据量的逐渐庞大应运而生。
2024-08-12 16:24:31
1276
原创 机器学习——基于随机森林模型的数据开发人员薪资预测
本文通过分析美国、加拿大和英国在2021-2024年期间的数据开发岗位人员薪资数据,建立随机森林预测模型,预测数据开发人员的未来薪资水平,并探究影响薪资的关键因素。首先,对获取的数据集中的数据进行预处理。然后,利用梯度提升树模型分析特征重要性,并选择关键特征。最后,建立随机森林模型进行预测,并通过性能指标评估模型效果。实验结果表明,本文建立的随机森林模型的预测效果并不理想,分析了效果不佳的原因并提出改进,希望对读者有一定的启发。
2024-08-11 10:37:34
990
原创 PTA练习—韩信点兵
在中国数学史上,广泛流传着一个“韩信点兵”的故事:韩信是汉高祖刘邦手下的大将,他英勇善战,智谋超群,为汉朝建立了卓越的功劳。据说韩信的数学水平也非常高超,他在点兵的时候,为了知道有多少兵,同时又能保住军事机密,便让士兵排队报数:按从1至5报数,记下最末一个士兵报的数为1; 再按从1至6报数,记下最末一个士兵报的数为5; 再按从1至7报数,记下最末一个士兵报的数为4; 最后按从1至11报数,最末一个士兵报的数为10;请编写程序计算韩信至少有多少兵。输入格式:本题无输入输出格式:输出
2021-10-24 22:30:24
567
原创 PTA练习-求给定精度的简单交错序列部分和 (15 分)
思路:计算序列部分和可知,这是一个连加问题,需要注意的是最后一项的值不能大于所输入的精度。所以只需利用循环结构判断哪一项到达所给精度的最后一项,连加后跳出循环即可。#include <stdio.h>int main(){ double sum=1,eps; double fz=1,fm=1,i=-1; scanf("%lf",&eps); while(fz/fm>eps) { fm=fm+3; ...
2021-10-19 11:25:05
2715
原创 PTA 练习—找出最小值(20分)
本题要求编写程序,找出给定一系列整数中的最小值。输入格式:输入在一行中首先给出一个正整数n,之后是n个整数,其间以空格分隔。输出格式:在一行中按照“min = 最小值”的格式输出n个整数中的最小值。输入样例:4 -2 -123 100 0输出样例:min = -123思路:首先,由题意可知使用循环结构比较大小,确定出最小值。其次,根据输入的第一个正整数确定循环次数(当我们已知循环次数的时候可以使用for()循环结构)。最后跳出循环,输出最小值。个人评价:思路很简.
2021-10-11 09:54:09
3207
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人