自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 Python使用正则表达式分离中英文数据_获取演员出演电影数量

获取演员出演电影数量目标:从中英文混合的‘主演’列中提取出演员中文名,并制作演员表(演员,出演电影数量)原数据截图:处理后截图实现代码import pandas as pdimport reinput_path = r'C:\Users\Administrator.DESKTOP-002ARSO\Desktop\tableau配套数据\中国电影网电影_data.xlsx'output_path = r'C:\Users\Administrator.DESKTOP-002ARSO\Des

2020-12-29 16:29:50 938 2

转载 python里的apply,applymap和map的区别

转自:[https://www.cnblogs.com/cymwill/p/7577369.html]apply 用在dataframe上,用于对row或者column进行计算;applymap 用于dataframe上,是元素级别的操作;map (其实是python自带的)用于series上,是元素级别的操作。如:>>> df = pd.DataFrame(np.random.randint(0,10,(4, 3)), columns=list('bde'), index=ra

2020-11-04 12:13:19 197

原创 MySQL数据分析2_tb用户行为分析

使用MySQL进行数据分析2_tb用户行为分析本文数据来源于:天池使用工具:MySQL,Excel1.简介用户行为是淘宝上用户行为的数据集,用于带有隐式反馈的推荐问题。该数据集由阿里巴巴提供。2.数据理解该数据集包括随机选择的约100万用户,以及这些用户在2017年11月25日至12月3日之间具有点击,购买,向购物车中添加商品和偏爱商品的行为,所有数据量超过1亿行,考虑到数据库运行时间,这里我就取了大概200W的值进行分析。字段理解如下:字段解释user_id用户编号

2020-09-24 01:07:35 295

原创 Mysql数据分析1_酒店预定需求分析

MySQL数据分析1_酒店预定需求分析本文所有数据来源于kaggle:Hotel booking demand使用工具:MySQL,Excel1.背景您是否想过一年中什么时候预定酒店房间?还是为了获得最佳每日房价而获得的最佳停留时间?如果您想预测酒店是否可能收到过多的特殊要求,该怎么办?该酒店预订数据集可以帮助您探索这些问题!2.提出问题1)酒店运营分析(城市酒店和假日酒店预订需求和入住率比较、客流量趋势、渠道等角度)2)用户分析(预定时长、入住时长、预定餐饮、特殊要求、出行人员结构、用户类型

2020-09-20 13:37:16 684

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除