- 博客(2)
- 收藏
- 关注
原创 Python数据挖掘06--淘宝网数据处理
淘宝数据:第一列标题,第二列链接,第三列价格,第四列评论 所用到数据sql文件点击下载一、数据预处理 数据预处理指的是对数据进行初步处理,把脏数据处理掉,否则很容易影响最终结果。 常见的的预处理包括: 1、缺失值处理 2、异常值处理 3、数据集成在数据量大的情况下采用删除处理法,是比较优质的一种处理方法。二、实战分析步骤: 1、爬取淘宝数据存入数据库(...
2018-02-28 23:41:24 1096 2
原创 Python数据挖掘05--词云(wordcloud)找出老九门中热门词语
注意 window系统安装wordcloud模块时可能会出现需要安装C++等错误,此时使用https://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy网站的whl自己进行安装将不会再报错资料中所用到老九门文件和图片,点击下载import wordcloud as wc # 词云模块import matplotlib.pylab as plb...
2018-02-28 22:31:52 445
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人