0/404-CSDN博客

原创 Olist巴西电商数据分析（二）

Olist巴西电商数据分析上篇指路：https://blog.csdn.net/jlycd/article/details/113887419文章目录Olist巴西电商数据分析项目背景搭建数据分析架构数据分析商品维度销售维度总结与建议项目背景本项目是来自kaggle上的数据集案例，记录了巴西电商平台Olist 2016,2018的真实业务数据数据，包含以下的内容。搭建数据分析架构主要通过用户，商家，产品，销售四个维度来展开分析各项指标。使用到的工具主要有python,excel,t

2021-02-23 23:04:10 2045 2

原创 Olist巴西电商数据分析（一）

Olist巴西电商数据分析文章目录Olist巴西电商数据分析项目背景搭建数据分析架构数据分析用户维度商家维度总结前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结二、使用步骤1.引入库2.读入数据总结项目背景本项目是来自kaggle上的数据集案例，记录了巴西电商平台Olist 2016,2018的真实业务数据数据，包含以下的内容。搭建数据分析架构主要通过用户，商家，产品，销售四个维度来展开分析各项指标。使用到的工具主要有python,excel,tableau等数据

2021-02-21 21:50:16 3599 4

原创 python实现Instagram网络爬虫

python实现Instagram网络爬虫instagram爬虫背景介绍爬虫的设计思路大致实现步骤代码数据展示数据简要分析instagram爬虫背景介绍Instagram是国际最大的社交媒体之一。这是一个巨大地相片分享社区群，全世界的网民们可以在Instagram上以快速，出色以及有趣的方式来与朋友分享照片，分享生活，实现信息的即时分享、传播互动。利用python语言从账户内获取到其个人基本信息：用户简介、发帖数、关注数、被关注数以及发布的图片信息：图片文件、发布时间、点赞数、评论数。通过数据筛选，

2021-01-27 15:19:08 7834 3

原创 sql做题记录（三）

题目来自leetcode记录题型，做题方法，错误原因和注意事项如有问题请及时纠正1.每日用户统计编写一个 SQL 查询，以查询从今天起最多 90 天内，每个日期该日期首次登录的用户数。假设今天是 2019-06-30.select a.login_date,count(a.user_id) as 'user_count' from(select distinct t.user_id,min(t.activity_date) as 'login_date' from Traffic twh

2021-02-21 13:54:11 603

原创机器学习笔记：随机森林

随机森林随机森林是一种集成算法，是对决策树模型的集成学习。目的是通过考虑多个评估器建模结果，汇总得到一个综合结果。集成算法包括bagging（装袋法），boosting（提升法），stacking（堆栈法）三种。装袋法的核心思想是构建多个相互独立的评估器，然后对其预测进行平均或多数表决原则来决定集成评估器的结果。装袋法的代表模型就是随机森林。提升法中，基评估器是相关的，是按顺序一一构建的。其核心思想是结合弱评估器的力量一次次对难以评估的样本进行预测，从而构成一个强评估器。提升法的代表模型有Adab

2021-02-12 17:06:06 789