自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_47572370的博客

原创挖掘数据集wine

挖掘数据集wine自定义参数，实现基于决策树的分类（绘图）准备工作：载入数据，查看数据特征基于决策树的分类（绘图）划分特征feature_name可以自行输入列表也可通过提取所需特征的列名，class_names则是写入需要分的类别，现有数据分酒类，即红酒，白酒，葡萄酒有关graphviz的安装包导入流程（基于泰坦尼克号数据对现实生存法则的研究分析7.2决策树模块）结论如下：红酒：od280/od315稀释葡萄酒含量大于2.115，酒精含量大于12.81，脯氨酸含量大于655

2022-02-22 21:59:13 600

原创招聘网探究分析报告（以描述性分析为主）

招聘网探究分析报告（以描述性分析为主）1 引言记得在我中学时，就听到过“大学生一毕业就失业”的言论。网上资料显示是大学扩招，书本理论知识与岗位真实需求脱节严重，善于纸上谈兵而不注重动手实践，自我定位过高骄子心态等的缘由。如果能提前了解现在的就业形势，了解整个就业市场缺少的人才、岗位任职资格等一些基本信息，然后能自学符合企业要求的技能，就完全碾压没有准备的人，俗话说的好，机会总是留给有准备的人。但是，有时候也是需要天时地利人和相结合。确实，天有不测风云，今年爆发新冠肺炎疫情，疫情对餐饮、旅游、住宿、娱

2022-02-20 16:38:27 2223

原创《Python数据分析与应用》第7章机器学习模型的应用实训部分

《Python数据分析与应用》第7章机器学习模型的应用实训部分(源于大学课程python数据分析)【目的及要求】以股票价格预测为主题，利用所学的机器学习方法建立模型对股价进行预测，股票价格既可以是个股价格，也可以是股票指数。1、到知网查阅文献资料，确定影响因素，即自变量;2、定义因变量和自变量;3、收集变量数据;4、建立多种回归预测模型;5、对模型结果进行比评价和比较1.有下图文献所得八个自变量（人民币兑美元汇率、国民生产总值、货币(M1)供应量(亿元)、一年期存款利率（%）、基本每

2022-02-17 20:28:51 2543

原创《Python数据分析与应用》第6章使用sklearn构建模型实训部分

《Python数据分析与应用》第6章使用sklearn构建模型实训部分((源于大学课程python数据分析))实训1 使用sklearn处理wine和wine_quality数据集1.使用pandas库分别读取wine数据集2.将wine数据集和wine_quality数据集的数据和标签拆分开拆分wine数据集和wine_quality数据集3.将wine,wine_quality数据集划分为训练集和测试集4.标准化wine数据集和wine_quality数据集5.对wi

2022-02-16 13:31:33 9531 2

原创《Python数据分析与应用》第5章使用Pandas进行数据预处理实训部分

《Python数据分析与应用》第5章使用Pandas进行数据预处理实训部分(源于大学课程python数据分析)实训1合并线损、用电量趋势与线路告警数据1.读取两表2.查看两表形状3.以ID和date两个键值作为主键进行内连接4.查看数据实训2 插补用户电量数据缺失值1.读取missing_data.csv表中的数据并将列名进行重命名操作2.查询缺失值所在位置3.使用SciPy库中interpolate模块中的lagrange对数据进行拉格朗日插值data删除缺失值行后

2022-02-14 19:10:50 11248 1

原创《Python数据分析与应用》第4章Pandas统计分析（2）实训部分

《Python数据分析与应用》第4章Pandas统计分析（2）实训部分（源于大学课程python数据分析）实训3 使用分组聚合方法进一步分析用户信息更新表和登录信息表1.根据read_csv提出数据2.使用groupby方法对用户信息更新表和登录信息表进行分组3.使用agg方法求取分组后的最早和最晚更新既登录时间3.1 agg方法提取最早和最晚更新时间3.2 agg方法提取最早和最晚登录时间4.使用size方法求取分组后的数据的信息更新次数与登录次数实训4 对用户信息更新

2022-02-13 19:46:28 7322

原创《Python数据分析与应用》第4章Pandas统计分析（1）实训部分

《Python数据分析与应用》第4章Pandas统计分析（1）实训部分（源于大学课程python数据分析)实训1 读取并查看P2P网络贷款数据主表的基本信息1.利用read_csv读取P2P网络贷款数据主表2.利用ndim属性查看主表维度、利用shape属性查看主表形状、利用memory_usage属性查看主表占用内存信息3.利用describe方法对主表进行描述性统计分析4.利用自定义函数剔除值相同或全为空的列，标准差表示的是样本数据的离散程度，标准差为0就是数组为空值，所以求全为空的

2022-02-13 19:33:48 11696

原创《Python数据分析与应用》第2章 Numpy数值计算基础实训部分

《Python数据分析与应用》第2章 Numpy数值计算基础实训部分（源于大学课程python数据分析）实训一创建数组并进行运算（1）创建一个数值范围为0-1，间隔为0.01的数组；（2）创建100个服从正态分布的随机数；（3）对创建的两个数组进行四则运算；（加减乘除运算）（4）对创建的随机数组进行简单的统计分析。（总和、均值、标准差、方差、最小值、最大值、最小值的索引、最大值的索引、累计和、累计积）实训二创建一个国际象棋的棋盘（1）创建一个8×8矩阵；（2）把1、

2022-02-12 23:23:16 3591

原创基于某地区高校数据探究大学生健康状态

基于某地区高校数据探究大学生健康状态1 大学生健康状态的主要影响因素研究1.1 对于计量用到的数据进行说明，并说明主要原因我们最主要估计的模型如下：其中A23是我们最关心的因变量是在校大学生健康状态，A1是性别，A14是喝酒频繁程度，B1是性格倾向，B201是我发觉自己为琐事烦恼，D9h是师生关系，D9i是学习氛围，E15是是否为了得到重视而积极表现自己，E201是密切程度-宿舍同学，E213是满意程度人际关系评分。1.2 对于计量结果进行研究1.2.1 人际关系满意度与大学生健康状态正

2022-02-08 23:22:39 982

原创 web前端技术课程作业

web前端技术课程作业1 网站的设计选题主题：我的家乡—浙江省绍兴市诸暨市目标用户：全国各地的游客意义：向他们介绍我美丽家乡的特色小镇、主导产业、旅游景区、美食、名人、著名高校等等，从经济、文化等方面全方位介绍，让全国各地的人们都了解我的家乡，并喜欢上这座城市。2 网站的内容规划（1）本网站设置6个栏目，分别是“特色小镇”、“主导产业”和“旅游景区”、“美食”、“名人”和“著名高校”，但主要介绍“主导产业”、“著名高校”和“美食”a)“主导产业”：经济是衡量一个城市的指标，因此会选择介绍与经济

2022-02-08 22:44:25 10057

原创 adult数据集的数据挖掘

adult数据集的数据挖掘（决策树）数据简介项目Value>50K, <=50K.booleanagecontinuousworkclassPrivate, Self-emp-not-inc, Self-emp-inc, Federal-gov, Local-gov, State-gov, Without-pay, Never-workedfnlwgtcontinuouseducationBachelors, Some-college

2022-02-06 15:31:36 2012

基于泰坦尼克号数据的python实现

基于泰坦尼克号数据对现实生存法则的研究分析的具体代码

2022-02-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除