python数据分析
文章平均质量分 88
python数据分析项目,新手练着玩的
杰瑞Jerry老哥
游戏开发之路,从小白到大白,初入门,一起成长
展开
-
项目:淘宝用户数据分析
一、项目背景1.项目描述:本项目数据集包含了2017年11月25日至2017年12月3日之间,共1亿条用户数据记录,从中抽取前500w条数据进行分析,字段由ID、商品ID、商品类目ID、行为类型和时间戳组成,并以逗号分隔。主要分析工具为python。2.数据集来源及介绍:来自阿里云天池官方数据集:User Behavior Data from Taobao for Recommendation字段名描述:列名称说明用户ID整数类型,序列化后的用户ID商品ID整数类原创 2020-10-16 10:50:13 · 2107 阅读 · 0 评论 -
练习(三国演义字频统计)
# -*- coding: utf-8 -*-"""Created on Sun Feb 23 16:53:08 2020@author: 15389"""#Calthreekingdoms.pyimport jiebatxt = open("threekingdoms.txt","r",encoding="utf-8").read()excludes = ("将军", "却说...原创 2020-02-23 21:49:16 · 192 阅读 · 0 评论 -
python代码入门练习1
# -*- coding: utf-8 -*-"""Created on Sat Feb 22 18:35:05 2020@author: 15389"""#CalStatisticsV1.pydef getNum(): #获取用户不定长度的输入 nums = [] iNumStr = input("请输入数值(回车退出):") while iNumStr ...原创 2020-02-22 18:45:04 · 99 阅读 · 0 评论 -
hamlet文本字频统计
#CalHamlet.pydef getText(): txt = open("hamlet.txt", "r").read() txt = txt.lower() for ch in '!@~#$%^&*(){}_+-=[]:"|?><\,./;': txt = txt.replace(ch, " ") return txthamletTxt = getTe...原创 2020-02-23 11:15:31 · 576 阅读 · 0 评论 -
基于游戏cookie cats数据的A/B测试
一、A/B测试背景介绍:① cookie cats游戏:类似国服的开心消消乐,三消游戏② 较难关卡作用:驱动应用内购买,使玩家强制休息从而增加和延长玩家对游戏的享受③ 任务:采用A/B测试分析较难关卡的位置(第几关)设置对于玩家留存的影响以及是否有显著差异二、字段解释:userid: 用户唯一标识version: 第一个较难级别关卡的设置(第30关或者第40关)sum_gamerounds: 玩家在安装后的第一周内玩的游戏回合数retention_1:玩家在安装1天后是否玩游戏(次日是否留原创 2020-09-07 21:57:09 · 511 阅读 · 0 评论 -
项目:kaggle房价预测
一、项目背景项目描述:比赛项目由 Kaggle 举办,要求选手依据爱荷华州房子的质量、面积、街区、壁炉个数等79个变量预测房子的价格。项目网址:House Prices: Advanced Regression Techniques二、代码展示tips:原代码在jupyter notebook上由python编写完成# Kaggle房价预测项目# 首先,导入需要用到的包import pandas as pdimport numpy as np%matplotlib inlineimp原创 2020-09-08 18:44:32 · 3894 阅读 · 2 评论