- 博客(7)
- 收藏
- 关注
原创 埃森哲大数据分析方法:学习笔记
数据分析框架第一步&业务理解第二步&数据理解:数据收集、数据清洗数据清洗:异常值判别异常值判断方法有:物理判断法&统计判断法 1、物理判断法:根据人们对客观事物、业务等已有的认识,判别由于外界干扰、人为误差等原因造成实测数据偏离正常结果,判断异常值。通常比较困难、主观性较强。 2、统计判断法:给定一个置信概率,并确定一个...
2018-12-03 17:10:18 3401
原创 用Python玩Wechat
In [1]: import itchatIn [2]: itchat.login()#爬取自己好友相关信息,返回一个json文件(ist类型的对象)In [3]: friends = itchat.get_friends(update=True)[0:]In [4]: type(friends)Out[4]: list #可以看到列表里的好友的后台数据到底是什么样的,由哪些...
2018-12-14 16:10:20 1241
原创 Pandas库DataFrame写入csv文件出现中文乱码问题解决方法
问题:使用 DataFrame 的 to_csv() 方法实现csv文件输出时,文件中出现中文乱码In [1]: frame.to_csv(r'C:\Users\dell\Desktop\wechat.csv', index=False, ...: encoding="utf_8")参数中设置了"utf_8"仍属不管用,结果如下:解决方案df.to_csv("cn...
2018-12-14 15:22:03 4320
原创 Python数据分析:数据预处理
数据预处理:数据的预处理是在对数据分类和分组之前所做的必要处理,内容包括数据的审核、筛选、排序等。当使用爬虫从网上获取数据时,获得的数据往往存在缺失、异常、格式不正确等情况。面对这些状况百出的原始数据,数据的预处理就显得尤为重要,数据分析师们往往也会在数据预处理上花费许多时间。 数据审核 数据筛选 数据排序 数据审核:数据审核就是检查数据中是否有错误。对于原始...
2018-12-03 16:25:19 719
原创 Python 数据分析初试
### 前期利用 python 爬虫在“静态页面结构”的网站 xxcity 上获取了一些二手房的数据。爬取静态网站是Spider新手的首选,这里不展开,感兴趣的朋友可以上网搜 静觅|爬虫 看看崔老师的爬虫教学。### 在储存原始数据时,为了后期使用 pandas 的二维数组生成 DataFrame ,故直接将原数据以 list 的格式保存在了 txt 文件中.In [1]: import...
2018-12-03 15:07:48 168
原创 Python map()函数:用 map() 和 lambda 重命名轴索引
python map(fun, [arg]+) 函数最少有两个参数,第一个参数为一个函数,第二个参数是对应的这个函数的参数(一般为一个或多个list)在 pandas 中可能为pd内置的各种数据结构(如:index)。map(lambda x: x[:4].upper(), data.index) # index: pd.indexpython 3.x 中 map() 函数返回的是 it...
2018-11-27 22:11:59 1940
原创 第一篇Blog——结合博文经验分享对产品经理的感悟
现在的状态 现在是2017年,我大二,专业是电子商务,武汉大学的学生。 从没想过会来武大念书,从没想过我以后会接触互联网,会念电子商务。 谈到产品经理IPM,可以说我从小就对这类工作有种归属感,小时候总是想着做银行的客户经理。现在也一样,我依然想着大学毕业后回到云南,找一家银行,做一名客户经理,快快乐乐的过一辈子。现在接触的东西多了,互联网真是
2017-11-16 20:03:02 350
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人