自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 李开复微博数据分析--微博爬虫、数据挖掘、数据可视化(持续更新)

由于不想做测试,内心一直想做数据挖掘/数据分析,果断辞职重新找了,这是第一篇自己出的分析报告,可能还不够专业,以后会继续进步哒,希望小伙伴们多多指导~通过对李开复微博的分析,发现了一些有趣的结论,一一叙来~1、数据采集       首先是爬取了李开复老师的微博,从2016-07-18 21:06:00到2009-08-27 15:11:32,总计12484条微博。        爬虫采

2016-07-19 18:29:13 9150 6

原创 sql基本操作总结

数据库是学了一遍一遍又一遍,但是平时不用,要学习的东西还很多,就容易忘掉一些,今天做个简单的整理,以便回头翻阅。基本的select语句:select [...] from tablename [where ] [group by] [having ] [order by[asc|desc],...]增删改查:增:insert into tablename [(列名,,,列名)] v

2016-07-25 15:24:54 301

原创 统计分析学习之数值分析方法

最近补了一些统计学的知识,大多都在这些年的学习中接触过,这里做个总结,以便回头方便看。从以下几个方面对数值进行分析:数值的位置平均数与中位数      这个最常见的就是平均值和中位数了,平均值指的是数据在数值上的中心位置,是所有数和的平均,而中位数是一个样本序列在数值上的中间,序列长度为奇数是,中位数就是最中间的那个。我们可以吧平均数理解为样本序列在数学上的中间位置,把中位数理解为

2016-07-25 11:01:11 1799

原创 最近用到的一些sql命令(持续更新)

1、在查询前几条时,mysql并不支持top n的操作,用的时limit.,例如要搜索李开复微博信息表中评论数排名前十的记录,可以如下的方式写:select * from weibolee order by remarkNum desc limit 0,10ps.limit后接的数字表示一个前开后闭的区间。

2016-07-20 18:18:58 287

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除