![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据实例分析
阿塔塔塔
关注机器学习&数据挖掘,推荐算法&排序算法,菜鸟一枚,永远在学习。
展开
-
数据可视化中需要注意的问题
最近在学哈佛数据分析的一门课 CS109 Data Science (http://cs109.github.io/2015/),其中 Lecture 3: Exploratory Data Analysis 主要讲的是数据建模前比较重要的一步,对数据进行合适的plot,这对我们初步了解数据,发现问题很有帮助。 以下的内容主要基于Lecture 3 的内容,图来自课中的讲义。可视化的目的交流 (原创 2016-05-12 22:08:24 · 1106 阅读 · 0 评论 -
分析某实习招聘网站上海地区的平均实习工资
关键字:爬虫 正则 python 之前学习过一点爬虫,爬过一些股票数据。也学过一点正则表达,不过还没有机会应用。 昨天刚好在看http://www.tuicool.com/articles/QBZzquY,一个有关如何学习数据分析的大致路径。打算再按照它给出的学习路径,从头有规划地再复习一下python和机器学习。看完里面提到的google的python课程中的正则表原创 2016-05-04 17:34:17 · 596 阅读 · 0 评论 -
数据分析实例--兰州二手房数据分析(一)
这篇博主要是想总结一下最近复习的知识点,爬虫和mysql以及pandas。 (一)数据获得 利用python中的selenium爬取http://esf.lz.fang.com/house-a0469/中城关区部分所有二手房的房价,面积,房屋位置,房间数,相对层数,朝向,建筑时间。selenium中主要用到的方法有: object.find_elements_by_tag_name obje原创 2016-07-17 21:38:34 · 1179 阅读 · 0 评论 -
数据分析实例--兰州二手房数据分析(二)
刚写完上一篇博,看狗熊会的微信就推送了北京二手房房价数据分析案例报告,好巧o(*≧▽≦)ツ。接着上一篇的内容,所有的分析都是在ipython notebook上完成的。数据来源:从网站上爬取(具体网址见上一篇文)。数据再次处理: 第一步:计算每间房屋的单位面积价格,加入到原有的DataFrame中,并存入mysql(也可以在mysql里直接操作)。第二步:将属性相对楼层的中、低,高改为类别变量0,原创 2016-08-10 17:08:52 · 1409 阅读 · 0 评论