自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 问答 (1)
  • 收藏
  • 关注

原创 复购率/回购率/新购人数

回购率#回购率第一步select date_month,userid from orderr group by date_month,userid order by date_month这里不论1号用户在本月购买多少次,只要购买就1,否则就0#回购率第二步select t1.date_month,count(t1.date_month),count(t2.date_month) from(select date_month,userid from orderr group by date_

2021-01-29 09:51:57 1308

原创 20200915电商数据分析 - 偏逻辑思维(一)

这是一个电商数据分析题目,可以用excel做,可以用sql做,可以用python做题目如下:数据源如下:链接:https://pan.baidu.com/s/1gM2NoS_1SxUCgPbf-9mgYg提取码:9zrsExcel篇:其他人用数据透析表做的SQL篇:我遇到一些问题,重新用pyhton做Python篇:如下import pandas as pdimport numpy as npimport matplotlib.pyplot as pltdata = pd.read

2020-11-01 19:34:09 534 1

原创 20200909 Vedio Game 游戏平台数据分析

数据集是游戏销售情况字段说明如下:• Rank - Ranking of overall sales• Name - The games name• Platform - Platform of the games release (i.e. PC,PS4, etc.)• Year - Year of the game’s release• Genre - Genre of the game• Publisher - Publisher of the game• NA_Sales - S

2020-09-10 22:11:11 628

原创 Airbin_0720

项目背景数据是从kaggle下载的,Airbnb是一个让大众出租住宿民宿的网站,提供短期出租房屋或房间的服务,并且以其独特性的居住体验发展迅速,这里我们拿到的数据是2019年纽约的民宿数据。这里需要注意一点,有的压缩包解压之后直接使用csv文件会有问题,正确的方式是,1)右击csv文件,打开方式选择txt,然后保存,Encloding选ANSI保存,2)再使用Excel打开csv文件,然后另存为,保存类型选择CSV UTF-8(逗号分隔),这样文件可以解决基本的中文乱码/列错位等等问题;impor

2020-08-03 20:30:49 643

原创 Kaggle项目 - Hotel Booking Demand

%matplotlib inlineimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.rc("font",family="SimHei",size="12") #用于解决中文显示不了的问题sns.set_style("whitegrid") Exploratory data analysis (EDA) 探索性数据分析一、Data Clean 数据清洗

2020-07-09 21:45:43 1899

原创 matplotlib颜色调用

输入color=‘颜色名字’选取对应的颜色

2020-07-09 21:23:17 284

原创 CDNOW用户购买行为分析 - 2020

这是一份用户消费行为的分析报告数据来源于网络,是一家CD网站的销售情况一、基础数据清洗import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport seaborn as snsplt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=False%matplotlib inlineplt.style.use(

2020-07-05 21:57:50 600

原创 SQL 分数排名 :最简单的解题思路

这道题很经典,解题思路是写给新手看的,对于高手可能挺简单的,但是对于初学者可能理解起来还是有一定的难度,如果您经查使用SQL,可以跳过了。SQL题目:编写一个 SQL 查询来实现分数排名。如果两个分数相同,则两个分数排名(Rank)相同。请注意,平分后的下一个名次应该是下一个连续的整数值。换句话说,名次之间不应该有“间隔”。根据上述给定的 Scores 表,你的查询应该返回如下,新增一列Rank,且按分数从高到低排列:解题思路:新增加一列rank排名,我们先写出基本语法:Select score

2020-06-08 07:09:02 1050

原创 爬虫 - 股票爬虫实例之腾讯证券

这里用的网站是腾讯证券,更详细的版本参考另一篇爬雪球网站股票:import bs4from bs4 import BeautifulSoupimport requestsimport reimport pandas as pd#获取网页源代码def gethtml(url): try: kv = {'User-Agent':'Mozilla/5.0'} r = requests.get(url,headers=kv,timeout=30)

2020-06-07 19:05:57 2254

原创 爬虫-股票爬虫细节说明版【初学者入】

完整的股票爬虫记录见这篇文章:这里是一个简洁版的,方便初学者更详细的讲解爬虫细节:股票列表从东风财富获取,个股信息从雪球网获取首先,我们先看看雪球网的个股信息,这里我们截图格力电器代码查看;注意我们最终要查的是所有的个股信息仔细查看可知,每一个个股第一个父标签都是<div class="container-sm float-left stock__main">,后面是子标签,包括各种分类信息,如股票名称,今开,最高等等,我们先拷贝一段简洁代码做基础演示说明;s = '''&l

2020-06-05 21:30:40 1438

原创 电商数据分析-Pandas

四、参照RFM模型,对用户进行分类找出有价值的用户RFM模型是衡量客户价值和客户创利能力的重要工具。该模型通过客户的**最近交易行为(Recency)、交易频率(Frequency)以及交易金额(Monetary)**三项指标来描述该客户的价值状况。一般来说,会将这三项指标分成几个区间进行评分,通过计算评分找到有价值的用户,并对用户进行分类。最近一次消费(Recency):是指最近一次消费距离上一次消费之间的时间长短。它反映了客户对产品的态度以及对品牌价值的信任度,它关乎消费者的存留状况。消费频率(F

2020-06-04 20:00:03 716

原创 电商数据分析-SQL

1. 项目背景:通过对现有用户购物行为的数据进行分析,深度探索用户的消费行为、消费规律、消费偏好,针对不同的用户群体,以便更精细化运营,取得更好的业务;2. 数据来源数据来源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=649&userId=1注:如果数据太大,可以通过系统抽样选取部分数据UserBehavior是阿里巴巴提供的一个淘宝用户行为数据集,本数据集(UserBehavior.csv)包含了2017年11月25日

2020-06-04 10:54:55 3105

原创 爬虫 - 股票爬虫实例之雪球网

视频连接:https://www.bilibili.com/video/BV1kx411S7Fh?p=47跟着老师做的,但是老师讲的百度股票已经没有了,所以用雪球网替代了,不过没有输出,也没有报错,请大神帮忙看看什么问题,谢谢!import reimport requestsfrom bs4 import BeautifulSoupdef getHTMLText(url,header)...

2020-04-12 17:30:08 5437 5

原创 淘宝商品价格爬取并保存文件

是跟着b站的北京理工大学视频学爬虫,编辑的,完了觉得挺简单的,老师的是打印出来就行,下面代码是,写入文件,保存到本地。相关视频:https://www.bilibili.com/video/BV1kx411S7Fh?p=44其他参考过的优秀代码:https://blog.csdn.net/Guanhai1617/article/details/104120581更新模块思路:需要导入pand...

2020-04-07 23:01:52 1716 5

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除