自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (2)
  • 收藏
  • 关注

原创 挖掘数据集wine

挖掘数据集wine自定义参数,实现基于决策树的分类(绘图)准备工作:载入数据,查看数据特征基于决策树的分类(绘图)划分特征feature_name可以自行输入列表也可通过提取所需特征的列名,class_names则是写入需要分的类别,现有数据分酒类,即红酒,白酒,葡萄酒有关graphviz的安装包导入流程(基于泰坦尼克号数据对现实生存法则的研究分析7.2决策树模块)结论如下:红酒:od280/od315稀释葡萄酒含量大于2.115,酒精含量大于12.81,脯氨酸含量大于655

2022-02-22 21:59:13 472

原创 招聘网探究分析报告(以描述性分析为主)

招聘网探究分析报告(以描述性分析为主)1 引 言记得在我中学时,就听到过“大学生一毕业就失业”的言论。网上资料显示是大学扩招,书本理论知识与岗位真实需求脱节严重,善于纸上谈兵而不注重动手实践,自我定位过高骄子心态等的缘由。如果能提前了解现在的就业形势,了解整个就业市场缺少的人才、岗位任职资格等一些基本信息,然后能自学符合企业要求的技能,就完全碾压没有准备的人,俗话说的好,机会总是留给有准备的人。但是,有时候也是需要天时地利人和相结合。确实,天有不测风云,今年爆发新冠肺炎疫情,疫情对餐饮、旅游、住宿、娱

2022-02-20 16:38:27 1905

原创 《Python数据分析与应用》第7章 机器学习模型的应用 实训部分

《Python数据分析与应用》第7章 机器学习模型的应用 实训部分(源于大学课程python数据分析)【目的及要求】以股票价格预测为主题,利用所学的机器学习方法建立模型对股价进行预测,股票价格既可以是个股价格,也可以是股票指数。1、到知网查阅文献资料,确定影响因素,即自变量;2、定义因变量和自变量;3、收集变量数据;4、建立多种回归预测模型;5、对模型结果进行比评价和比较1.有下图文献所得八个自变量(人民币兑美元汇率、国民生产总值、货币(M1)供应量(亿元)、一年期存款利率(%)、基本每

2022-02-17 20:28:51 2087

原创 《Python数据分析与应用》第6章 使用sklearn构建模型 实训部分

《Python数据分析与应用》第6章 使用sklearn构建模型 实训部分((源于大学课程python数据分析))实训1 使用sklearn处理wine和wine_quality数据集1.使用pandas库分别读取wine数据集2.将wine数据集和wine_quality数据集的数据和标签拆分开拆分wine数据集和wine_quality数据集3.将wine,wine_quality数据集划分为训练集和测试集4.标准化wine数据集和wine_quality数据集5.对wi

2022-02-16 13:31:33 8417 2

原创 《Python数据分析与应用》第5章使用Pandas进行数据预处理 实训部分

《Python数据分析与应用》第5章使用Pandas进行数据预处理 实训部分(源于大学课程python数据分析)实训1合并线损、用电量趋势与线路告警数据1.读取两表2.查看两表形状3.以ID和date两个键值作为主键进行内连接4.查看数据实训2 插补用户电量数据缺失值1.读取missing_data.csv表中的数据并将列名进行重命名操作2.查询缺失值所在位置3.使用SciPy库中interpolate模块中的lagrange对数据进行拉格朗日插值data删除缺失值行后

2022-02-14 19:10:50 9998

原创 《Python数据分析与应用》第4章Pandas统计分析(2) 实训部分

《Python数据分析与应用》第4章Pandas统计分析(2) 实训部分(源于大学课程python数据分析)实训3 使用分组聚合方法进一步分析用户信息更新表和登录信息表1.根据read_csv提出数据2.使用groupby方法对用户信息更新表和登录信息表进行分组3.使用agg方法求取分组后的最早和最晚更新既登录时间3.1 agg方法提取最早和最晚更新时间3.2 agg方法提取最早和最晚登录时间4.使用size方法求取分组后的数据的信息更新次数与登录次数实训4 对用户信息更新

2022-02-13 19:46:28 6759

原创 《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分

《Python数据分析与应用》第4章Pandas统计分析(1) 实训部分(源于大学课程python数据分析)实训1 读取并查看P2P网络贷款数据主表的基本信息1.利用read_csv读取P2P网络贷款数据主表2.利用ndim属性查看主表维度、利用shape属性查看主表形状、利用memory_usage属性查看主表占用内存信息3.利用describe方法对主表进行描述性统计分析4.利用自定义函数剔除值相同或全为空的列,标准差表示的是样本数据的离散程度,标准差为0就是数组为空值,所以求全为空的

2022-02-13 19:33:48 10631

原创 《Python数据分析与应用》第2章 Numpy数值计算基础 实训部分

《Python数据分析与应用》第2章 Numpy数值计算基础 实训部分(源于大学课程python数据分析)实训一 创建数组并进行运算(1)创建一个数值范围为0-1,间隔为0.01的数组;(2)创建100个服从正态分布的随机数;(3)对创建的两个数组进行四则运算;(加减乘除运算)(4)对创建的随机数组进行简单的统计分析。(总和、均值、标准差、方差、最小值、最大值、最小值的索引、最大值的索引、累计和、累计积)实训二 创建一个国际象棋的棋盘(1)创建一个8×8矩阵;(2)把1、

2022-02-12 23:23:16 3233

原创 基于某地区高校数据探究大学生健康状态

基于某地区高校数据探究大学生健康状态1 大学生健康状态的主要影响因素研究1.1 对于计量用到的数据进行说明,并说明主要原因我们最主要估计的模型如下:其中A23是我们最关心的因变量是在校大学生健康状态,A1是性别,A14是喝酒频繁程度,B1是性格倾向,B201是我发觉自己为琐事烦恼,D9h是师生关系,D9i是学习氛围,E15是是否为了得到重视而积极表现自己,E201是密切程度-宿舍同学,E213是满意程度人际关系评分。1.2 对于计量结果进行研究1.2.1 人际关系满意度与大学生健康状态正

2022-02-08 23:22:39 710

原创 web前端技术课程作业

web前端技术课程作业1 网站的设计选题主题:我的家乡—浙江省绍兴市诸暨市目标用户:全国各地的游客意义:向他们介绍我美丽家乡的特色小镇、主导产业、旅游景区、美食、名人、著名高校等等,从经济、文化等方面全方位介绍,让全国各地的人们都了解我的家乡,并喜欢上这座城市。2 网站的内容规划(1)本网站设置6个栏目,分别是“特色小镇”、“主导产业”和“旅游景区”、“美食”、“名人”和“著名高校”,但主要介绍“主导产业”、“著名高校”和“美食”a)“主导产业”:经济是衡量一个城市的指标,因此会选择介绍与经济

2022-02-08 22:44:25 9852

原创 adult数据集的数据挖掘

adult数据集的数据挖掘(决策树)数据简介项目Value>50K, <=50K.booleanagecontinuousworkclassPrivate, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-workedfnlwgtcontinuouseducationBachelors, Some-college

2022-02-06 15:31:36 1732

基于泰坦尼克号数据的python实现

基于泰坦尼克号数据对现实生存法则的研究分析的具体代码

2022-02-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除