自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 从爬取微博中搜索的热门事件到数据分析处理全过程(一)

从爬取微博中搜索的热门事件到数据分析处理全过程(一)本文主要阐述了作者爬取新浪微博中搜索关键词搜到的微博,不涉及技术上的讲解,主要是大体思路,因为本人比较懒,可能第二部分或遥遥无期,但是还是希望大家多多支持: 一、爬取对象及缘由我爬取的主要是关于医患冲突的微博,初衷是为了分析医患冲突的舆情。想要爬取的对象有用户名、正文、时间、转发数、点赞数、还有评论数。爬取正文是可以做情感分析或...

2018-03-07 19:54:10 15968 3

原创 如何用网页渲染自己d3可视化成果——搭建git.gits 并由bl.ocks.org渲染

一、bl.ocks.org简介Bl.ocks(发音为“Blocks”)是一个用于共享GitHub Gist上托管的代码示例的简单查看器。 例如,如果您的Gist URL是:https://gist.github.com/mbostock/1353700将“gist.github.com”替换为URL中的“bl.ocks.org”以查看它:https://bl.ocks.

2018-02-01 11:23:28 693

原创 利用python实现对分类变量与数值变量混合的数据进行聚类分析

最近朋友想请我帮忙分析一下关于他们公司客户群体的数据,他的目的是希望将用户分为几个类别,当然我首先想到的便是聚类了。但是数据中有一个问题令我十分困惑,那便是数据集中既有分类变量又有数值变量,针对这种情况我们应该怎么处理呢?经过一番搜索与尝试,我个人利用了两种方法,仅供大家参考。一、数据预览当然,作为一个数据分析师,第一步要对数据进行初步探索,import pandas as p

2018-01-31 18:51:06 24190 5

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除