自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

转载 数据分析学习之路——(十)专题分析:怎样挖掘4w篇文章中的隐藏信息

说明 随着现代社会互联网不断发展壮大的趋势,越来越多的专题网站、论坛也趁着东风连续高速发展。广大互联网用户身处这个“信息爆炸”的时代,怎样才能选出令自己感兴趣的优质内容,已成了大多数互联网用户最为关注的目的。也正是如此,对于网站运营来讲,如何持续保持高产出、高质量、高用户、...

2018-04-20 15:12:00 601

转载 数据分析学习之路——(九)给留言数据贴情感标签,其实很简单

最近一直忙着找工作的事,难得抽出一点时间更新博客。前段时间仔细研究了一篇文章——运用机器学习来预测情感分类,也就是数据分析中最基本的分类模型的应用,感觉很有意思。于是自己在这篇文章基础上,完善了一下思路和代码,既有可视化的数据体验,也得到了不错的预测结果(主要靠调参数)。本文借...

2018-03-15 17:42:00 1308

转载 python爬虫之模拟登录

最近应朋友要求,帮忙爬取了小红书创作平台的数据,感觉整个过程很有意思,因此记录一下。在这之前自己没怎么爬过需要账户登录的网站数据,所以刚开始去看小红书的登录认证时一头雾水,等到一步步走下来,最终成功,思路通了感觉其实还是很简单。 解决思路 一开始我就只有这...

2018-01-23 20:57:00 1062

转载 数据分析学习之路——(八)分类算法介绍

前面几篇文章都是从数据分析介绍讲到描述统计分析,其实数据分析还需要使用机器学习的相关知识用来建立不同的分析模型,最终对数据信息进行深入的分析和挖掘。在实际工作当中,我们需要对数据进行特征分析,并且从数据中获取有价值的信息,并且为数据产品的市场服务。对于机器学习这一块,我是从分类...

2017-12-23 21:25:00 521

转载 数据分析学习之路——(七)用数据分析教你如何买基金(2)

前一篇文章主要介绍了获取这些基金数据的过程,现在根据这些数据提取出我需要的信息——有哪些绩优基金值得入手。主要通过基金的种类(股票型、混合型等)、风险(中、低等)、净值趋势等维度来对比分析。由于爬到的数据比较规范,没有太多异常数据,因此在处理原始数据时,也只是做了去除空值(基金...

2017-11-02 22:43:00 470

转载 数据分析学习之路——(六)用数据分析教你如何买基金(1)

最近基金行情感觉很不错,想着再入手几只,于是有了通过数据分析来帮我做决策这个想法。由于我手里的是一只南方基金的产品,因此为了对比决定把南方基金的基金信息(截止2017.10.27)给扒下来。我仔细分析了该网站我要的产品信息所在的页面,最终决定将所有的产品信息保存为两个文件。一个...

2017-10-30 00:57:00 185

转载 数据分析学习之路——(五)用数据告诉你电影的市场趋势

随着社会的多元化,越来越多的影视作品走入人们的生活中。但是近年来鲜有几部新制作的电影能俘获观众的心,到底是观众越来越挑剔,还是电影作品本身不够吸引力?如果你是有一个电影公司,你想制作一部电影作品,你有想过拍一部什么样的电影吗?你会选择一名什么样的导演呢?这里由Movie Dat...

2017-10-23 01:14:00 1153

转载 数据分析学习之路——(四)爬虫初探—链家网城市新开楼盘房价

做数据分析离不开数据集,一般来讲数据集来源分为两种:已有数据和待获取数据。已有数据指公司内部数据或者网络共享数据,存在数据库或者文件里,这种数据已经有固定的字段信息,在数据分析过程中可以直接对数据进行整理后分析。待获取数据就是网络上或者文本中需要去查找获取的关键数据,一般通过爬...

2017-10-10 23:05:00 337

转载 数据分析学习之路——(三)从泰坦尼克号撞击冰山后开始说起

1912年4月14日,Titanic号在其处女航程中,不幸撞击冰山沉没在大西洋,超过1500名船员和乘客遇难,成为人类灾难史上沉痛的一幕,而与之相关的一系列谣言猜测也为后人津津乐道。那么我们不禁会问,船上这么多人,到底有多少人活下来了,这些活下来的又是什么人呢?下面我们从一份泰...

2017-09-28 22:01:00 594

转载 数据分析学习之路——(二)链家网部分城市新开楼盘分析

近一个月一直在Udacity学习数据分析课程,因此很久没有更新博客。我根据自己的学习安排,已经完成提交了项目一——对Stroop现象用数理统计方法进行假设检验并得出结论。这次来分析一下链家网公开的部分城市新楼盘数据(2017.07获取的数据),主要对城市楼盘数量、价格进行分析。...

2017-09-17 22:55:00 257

转载 数据分析学习之路——(一)初衷

毕业以来一直在做web系统开发,主要为证券、基金公司等金融公司机构做呼叫中心产品开发,总的来说比较顺风顺水。但是很清楚自己不适合做纯开发工作,再加上对接触的客服业务也几乎不感兴趣,于是想着要改变,年轻多踩点坑没坏处! 曾经一度想找一份互联网产品经理的工作,但是产品...

2017-08-11 21:49:00 129

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除