自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

原创 电商打折套路分析

项目要求1、从现有数据中,分析出“各个品牌都有多少商品参加了双十一活动?要求:① 计算得到:商品总数、品牌总数② 双十一当天在售的商品占比情况(思考:是不是只有双十一当天在售的商品是“参与双十一活动的商品?”)③ 未参与双十一当天活动的商品,在双十一之后的去向如何?④ 真正参与双十一活动的品牌有哪些?其各个品牌参与双十一活动的商品数量分布是怎样的?用bokeh绘制柱状图表示提示:...

2019-07-31 11:06:32 422

原创 数据时代的网络游戏设计与运营

一、什么是数据?二、什么是数据分析?三、为什么要做数据分析?1.游戏本身就是海量数据2. 游戏系统的复杂性3. 激烈的市场竞争4. 新技术的发展游戏数据分析是做什么?一、数据的来源(游戏内外)二、数据分析工作的内容1.日常数据监控游戏人气(新增、活跃、留存、在线、参与)游戏体验(硬件配置、软件系统、非正常退出、网络延迟)3.游戏收入(充值、消费、付费率、ARPU、道具销售...

2019-07-05 00:53:30 217

原创 利用Python对微信好友数据进行分析

一直就想着做个微信好友数据分析,折腾了一天总算是勉强完成了。本文参考:微信好友大数据分析Python基于jieba库进行简单分词及词云功能实现方法本文会使用到的第三方模块:itchat:微信网页版接口封装Python版本,在本文中用以获取微信好友信息。jieba:结巴分词的 Python 版本,在本文中用以对文本信息进行分词处理。matplotlib: Python 中图表绘制模块...

2019-03-03 15:01:50 870 3

原创 泰坦尼克号获救问题

数据来源:Kaggle数据集 → 共有1309名乘客数据,其中891是已知存活情况(train.csv),剩下418则是需要进行分析预测的(test.csv)字段意义:PassengerId: 乘客编号Survived :存活情况(存活:1 ; 死亡:0)Pclass : 客舱等级Name : 乘客姓名Sex : 性别Age ...

2019-02-27 15:33:28 909

原创 课程2.1 缺失值处理

数据缺失主要包括记录缺失和字段信息缺失等情况,其对数据分析会有较大影响,导致结果不确定性更加显著缺失值的处理:删除记录 / 数据插补 / 不处理导入相关模块import numpy as npimport pandas as pdimport matplotlib.pyplot as pltfrom scipy import stats% matplotlib inline判断是...

2019-02-22 15:18:27 339

原创 中国城市资本流动问题探索

数据:全国2013-2016所有企业间的投融资信息数据作业要求1、查看全国城际控股型投资关系要求:① 通过“data.xlsx”导出csv后,直接通过gephi看全国投资情况,有什么发现?② 分别筛选出“同城投资”、“跨城投资”的TOP20,比较一下两类投资的数据分布** 按照2013-2016年的汇总数据来计算** 分开比较2013-2016四个年度的数据** 需要绘制柱状图来辅...

2019-02-14 23:41:30 401 2

原创 房价影响因素挖掘

作业要求:1、数据清洗、整合要求:①将“house_rent”、“house_sell”分别读取②分别计算平方米建筑面积的月租金、每平方米建筑面积的房价③将数据按照小区名合并import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport warningswarnings.filterwarni...

2019-02-13 20:10:10 713 3

原创 城市餐饮店选址分析

作业要求:1、从三个维度“口味”、“人均消费”、“性价比”对不同菜系进行比较,并筛选出可开店铺的餐饮类型要求:① 计算出三个维度的指标得分② 评价方法:口味 → 得分越高越好性价比 → 得分越高越好人均消费 → 价格适中即可③ 制作散点图,x轴为“人均消费”,y轴为“性价比得分”,点的大小为“口味得分”绘制柱状图,分别显示“口味得分”、“性价比得分”建议用bokeh做图实...

2019-02-11 23:53:12 1268 3

原创 课程3.3 KNN最邻近分类

什么是分类分析?分类指的是从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类的分析方法。分类问题的应用场景:分类问题是用于将事物打上一个标签,通常结果为离散值。例如判断一副图片上的动物是一只猫还是一只狗,分类通常建立在回归之上。KNN最邻近分类算法最邻近分类算法,简称KNN,最简单的机器学习算法之一核心逻辑:在距离空间里,如果一...

2019-02-05 21:36:47 183

原创 课程3.5 模特卡罗模拟理论概述

什么是蒙特卡罗方法?蒙特卡罗方法,又称随机抽样或者统计 试验方法,是以概率和统计理论方法为基础的一种计算方法。使用随机数(或更常见的为伪随机数)来解决很多计算问题的方法。将所求解的问题同一定的概率模型相联系,用电子计算机实现统计模拟或抽样,以获得问题的近似解。1.基本原理蒙特卡罗通过抓住事物运动的几何数量和几何特征,利用数字方法来加以模拟,即进行一种数字模拟实验,它是以一个概率模型为基础,...

2019-01-26 17:26:57 2079

原创 股票数据定向爬虫

股票数据定向爬虫目的:获取上交所和深交所所有股票的名称和交易信息输出:保存到文件中技术路线:requests-bs4-re候选数据网站的选择选取原则:股票信息静态存于HTML页面中,非js代码生成,没有Robots协议限制选取方法:浏览器F12,源代码查看数据网站的确定获取股票列表东方财富网:http://quote.eastmoney.com/stocklist.html获...

2019-01-24 23:07:46 2717 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除