![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
jupyter
文章平均质量分 70
像风一样自由2020
这个作者很懒,什么都没留下…
展开
-
解决failed to execute WindowsPath(‘dot‘), make sure the Graphviz executables are on your systems‘ PATH
绘制决策树-解决安装graphviz出现错误的问题原创 2023-01-12 09:57:34 · 16221 阅读 · 6 评论 -
心跳信号分类预测的05模型融合
模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging),log融合stacking/blending:构建多层模型,并利用预测结果再拟合预测。boosting/bagging(在xgboost,Adaboost,GBDT中已经用到):多树的提升方法5.3 相关理原创 2021-03-21 20:53:44 · 375 阅读 · 0 评论 -
心电图心跳信号分类预测02_EDA数据分析
Task 2 数据分析Tip: 此部分为零基础入门数据挖掘的 Task2 EDA-数据探索性分析 部分,带你来了解数据,熟悉数据,和数据做朋友,欢迎大家后续多多交流。赛题:心电图心跳信号多分类预测2.1 EDA 目标EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。当了解了数据集之后我们下一步就是要去了解变量间的相互关系以及变量与预测值之间的存在关系。引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和特征集让原创 2021-03-18 17:25:31 · 378 阅读 · 0 评论 -
心跳信号分类预测的03特征工程
Task3 特征工程此部分为零基础入门数据挖掘-心跳信号分类预测的 Task33.1 学习目标学习时间序列数据的特征预处理方法学习时间序列特征处理工具 Tsfresh(TimeSeries Fresh)的使用3.2 内容介绍数据预处理时间序列数据格式处理加入时间步特征time特征工程时间序列特征构造特征筛选使用 tsfresh 进行时间序列特征处理import pandas as pdimport numpy as npimport tsfresh as t原创 2021-03-16 14:22:46 · 219 阅读 · 0 评论 -
数据挖掘-心电图心跳信号分类预测01
数据挖掘-心跳信号分类预测对应比赛:https://tianchi.aliyun.com/competition/entrance/531883/introductionimport osimport gcimport mathimport pandas as pdimport numpy as npimport lightgbm as lgbimport xgboost as xgbfrom catboost import CatBoostRegressorfrom sklearn原创 2021-03-15 10:30:31 · 384 阅读 · 2 评论 -
利用GAN生成fashion-mnist图像
利用GAN生成fashion-mnist图像参考资料:MOOC上的课程原创 2020-11-29 17:12:21 · 651 阅读 · 0 评论 -
pandas学习笔记-第10章-综合练习
第一步导入所需的库一、评委打分某比赛有1000名选手,300位评委打分,每个选手由三个不同的评委打分,每位评委打10位选手的分现在需要将各个评委的编号转到列索引,行索引不变,表格内容为打分分数,缺失值(即选手i没有被评委j打分)用’-'填充二、企业收入熵指数一个企业的产业多元化水平可以由收入熵指数计算衡量,其公式为−Σ???? ???? ln???? ????−ΣPilnPi,其中i表示第i个收入类型,???? ????Pi表示该类型收入额所占整个收入额的比重(因此Σ??原创 2020-06-30 09:54:03 · 887 阅读 · 0 评论 -
pandas学习笔记-第9章-时序数据的处理
同样,首先导入相应库和数据。一、时序的创建二、时序的索引及属性三、重采样四、窗口函数【练习一】 现有一份关于某超市牛奶销售额的时间序列数据,请完成下列问题:(a)销售额出现最大值的是星期几?(提示:利用dayofweek函数)(b)计算除去春节、国庆、五一节假日的月度销售总额(c)按季度计算周末(周六和周日)的销量总额(d)从最后一天开始算起,跳过周六和周一,以5天为一个时间单位向前计算销售总和(e原创 2020-06-28 10:24:39 · 333 阅读 · 0 评论 -
pandas学习笔记-第8章-分类数据
pandas学习笔记-第8章-分类数据首先导入库和数据一、category的创建及其性质二、分类变量的排序三、分类变量的比较操作【练习一】 现继续使用第四章中的地震数据集,请解决以下问题:(a)现在将深度分为七个等级:[0,5,10,15,20,30,50,np.inf],请以深度等级Ⅰ,Ⅱ,Ⅲ,Ⅳ,Ⅴ,Ⅵ,Ⅶ为索引并按照由浅到深的顺序进行排序。(b)在(a)的基础上,将烈度分为4个等级:[0,3,4,5,np.inf],依次对南部地区的深度和原创 2020-06-25 15:16:52 · 226 阅读 · 0 评论 -
pandas学习笔记-第7章-文本数据
第7章-文本数据首先导入库一、string类型的性质二、拆分与拼接三、替换广义上的替换,就是指str.replace函数的应用,fillna是针对缺失值的替换,上一章已经提及提到替换,就不可避免地接触到正则表达式,这里默认读者已掌握常见正则表达式知识点,若对其还不了解的,可以通过(https://regexone.com/)来熟悉四、子串匹配与提取五、常用字符串方法. 练习【练习一】 现有一份关于字符串的数据集原创 2020-06-23 10:54:29 · 301 阅读 · 0 评论 -
pandas学习笔记-第六章-缺失数据的处理方法
本文所用pandas版本是1.0.0Pandas在步入1.0后,对数据类型也做出了新的尝试,尤其是Nullable类型和String类型,了解这些可能在未来成为主流的新特性是必要的首先导入所需的相关库和数据head() 默认显示前5行,也可以指定显示前3行如下图同样可以指定查看后3行数据一、缺失观测及其类型1. 了解缺失信息(a)isna和notna方法对Series使用会返回布尔列表以class为例,缺失4个数据。从这个图知道有0-34行共35行数据,class有31个值,原创 2020-06-22 11:07:31 · 510 阅读 · 0 评论