数据挖掘
跌跌撞撞进大坑
哈哈
展开
-
pandas+sklearn:常用API介绍总结
1.pandas:常用API总结df的属性:df.values\df.columns\df.index\df.dtypes等df.info()df.describe() # 只对数据类型的字段进行计算显示df.head()df.get_dtype_counts()df.loc[行,列]索引的名字—data.loc[‘2018-02-27’:‘2018-02-22’, ‘字段名’]df.iloc[行,列]索引的下标—data.iloc[0:100, 0:2].head()df.reset_i原创 2020-12-06 00:54:12 · 1124 阅读 · 0 评论 -
常见集成学习算法模型&LightGBM示例
集成学习——介绍是一种机器学习范式。在集成学习中,我们会训练多个模型(通常称为 弱学习器)解决相同的问题,并将它们结合起来以获得更好的结果。最重要的假设是:当弱模型被正确组合时,我们可以得到更精确和/或更鲁棒的模型。有自助聚合(bagging)、提升法(boosting)、堆叠法(stacking)以及许多其它的基础集成学习模型常见的三种集成学习模型bagging——可以并行执行,每一棵树权重是一样的随机森林boosting——串行执行的,后一棵树学习的是前一棵树模型的error(原创 2020-12-06 00:10:51 · 2179 阅读 · 0 评论 -
关联分析规则---Apriori算法的理解和使用
apriori:‘先验’算法(无监督学习)应用场景:1.啤酒、尿不湿;2.大量数据中(购物小票)找到经常在一起出现的物品组合3.库存管理(摆放);4.促销页面设计;5.捆绑销售;6.内容推荐相关概念支持度:物品或物品组合,在所有数据中出现的概率(计算物品A的概率)[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-BnjUNLOJ-1606633912505)(F:\资料\py\py资料\知识点\数据分析\关联规则—apriori\support.png)]原创 2020-11-30 23:41:37 · 2489 阅读 · 1 评论