- 博客(4)
- 收藏
- 关注
原创 李开复微博数据分析--微博爬虫、数据挖掘、数据可视化(持续更新)
由于不想做测试,内心一直想做数据挖掘/数据分析,果断辞职重新找了,这是第一篇自己出的分析报告,可能还不够专业,以后会继续进步哒,希望小伙伴们多多指导~通过对李开复微博的分析,发现了一些有趣的结论,一一叙来~1、数据采集 首先是爬取了李开复老师的微博,从2016-07-18 21:06:00到2009-08-27 15:11:32,总计12484条微博。 爬虫采
2016-07-19 18:29:13 9150 6
原创 sql基本操作总结
数据库是学了一遍一遍又一遍,但是平时不用,要学习的东西还很多,就容易忘掉一些,今天做个简单的整理,以便回头翻阅。基本的select语句:select [...] from tablename [where ] [group by] [having ] [order by[asc|desc],...]增删改查:增:insert into tablename [(列名,,,列名)] v
2016-07-25 15:24:54 301
原创 统计分析学习之数值分析方法
最近补了一些统计学的知识,大多都在这些年的学习中接触过,这里做个总结,以便回头方便看。从以下几个方面对数值进行分析:数值的位置平均数与中位数 这个最常见的就是平均值和中位数了,平均值指的是数据在数值上的中心位置,是所有数和的平均,而中位数是一个样本序列在数值上的中间,序列长度为奇数是,中位数就是最中间的那个。我们可以吧平均数理解为样本序列在数学上的中间位置,把中位数理解为
2016-07-25 11:01:11 1799
原创 最近用到的一些sql命令(持续更新)
1、在查询前几条时,mysql并不支持top n的操作,用的时limit.,例如要搜索李开复微博信息表中评论数排名前十的记录,可以如下的方式写:select * from weibolee order by remarkNum desc limit 0,10ps.limit后接的数字表示一个前开后闭的区间。
2016-07-20 18:18:58 287
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人