数据分析
ZwY*
这个作者很懒,什么都没留下…
展开
-
数据分析之pandas 数据清洗
(1)当打印dataframe的时候数据多可能pycharm 的控制台会显示不全,下面几行代码显示所有行和列:#显示所有列pd.set_option('display.max_columns', None)#显示所有行pd.set_option('display.max_rows', None)#设置value的显示长度为100,默认为50pd.set_option('max_co...原创 2019-06-06 20:07:40 · 1155 阅读 · 0 评论 -
51job pandas数据清洗与pycharts画图分析
上一篇想要的数据已经基本都爬到了,下一步就是数据的清洗了。仔细观察了数据的特征,发现数据中存在太多的脏数据了,就例如很多搞房地产的,销售的,等等很多其他的一些无关职业,并且还包含很多重复项。我就把数据一遍一遍的清洗,第一遍我先在职位标题中挑出来带有特定关键词的职位,例如我搜索的是大数据的工作,那么我的关键词里就包含['数据', '分析', 'ETL', 'java', 'JAVA', '人工智...原创 2019-06-13 16:12:01 · 1502 阅读 · 3 评论 -
关于pyecharts安装导入Bar,Grid出错 飘红
在做可视化分析的时候需要用到pyecharts,然而呢,我就直接pip install pyecharts,默认安装的是最新版的,但是安装完毕发现Bar包导入会失败,然后再网上找了好久有博主说版本不匹配直接换成0.1.9.4版本的,然后我试了试,发现一部分包能导入,但是仍然有一部分不行,之后有看到其他博主说下载最新版,因为有扩展包,要在charts子文件下导入,例如:from pyechar...原创 2019-06-02 08:45:43 · 4070 阅读 · 1 评论 -
数据分析项目实战之淘宝女装店铺销售分析(二)excel数据分析篇
淘宝的XX店铺女装信息已经都放到数据库里了,这篇主要是记录一下把得到的数据合理整合分析。读完本文可以了解到:店铺的的销售额在哪个价位相对稳定的,如果有不稳定的有改进的方式吗? 不同商品的价格区间的销售情况,提高那个价位的销量能更快提升销售额? 线上价位热销是否受爆款影响?使用数据的大小是1126*5数据属性包括 衣服名称,现价,原价,销量,评论数一 :数据导出...原创 2019-07-30 15:14:42 · 11175 阅读 · 2 评论 -
数据分析项目实战之淘宝女装店铺销售分析(一)数据获取篇
淘宝京东电商数据的获取原创 2019-07-26 14:08:58 · 4931 阅读 · 0 评论 -
数据分析项目实战之用户消费行为分析
数据分析项目中固然是用到很多的数据分析工具和技巧,但是业务知识也占比不小,本案例分析了来自CDNow网站的一份用户购买CD明细,业务结合技术进一步分析用户的消费行为,提高决策质量。CD数据包括用户ID,购买日期,购买数量,购买金额四个字段。数据下载:https://pan.baidu.com/share/init?surl=pL2qo1H密码g6vv用到的工具,pycharm,pyth...原创 2019-07-23 14:38:50 · 15928 阅读 · 9 评论