自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 BeautifulSoup简单的自助抓取一点信息

#!/usr/bin/envpython# -*- coding: utf-8 -*-#coding:utf-8import urllib2from bs4import BeautifulSoupoutput_file=open('qczj_brand_changshang.txt','a')url_test='http://car.autohome.com

2016-08-31 23:42:53 566

转载 回车符,换行符的区别

回车符号和换行符号产生背景:     关于“回车”(carriage return)CR 和“换行”(line feed)LF 这两个概念的来历和区别。在计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字

2016-08-31 14:45:43 3501 1

原创 利用tableau集功能,分析看车潜客的颜色偏好

比如,有一份样例数据,显示长安的潜客,和众泰的潜客,分别喜欢看什么颜色的车,看各种颜色的人数有多少。但是颜色比较琐碎,考虑从颜色里创建集。 比如,查看人数最多的TOP N中颜色。 看到集合的定义很灵活,可以自己定义列表,也可以自己定义条件,也可以选择TOP, 比如,我们想让用户可以灵活的指定看TOP多少,于是这里创建一个参数‘最受欢迎的TOP N’,这个参数作为

2016-08-31 00:39:05 3892

原创 tableau分组,灵活的对各个省分组统计

Tableau的分组,不仅仅可以灵活的指定柱状体的分组,而且可以灵活的把维度或者度量也分组。 比如,我想把江西和河南算一个组比如华中组,那么,我不用一个一个的把所有江西和河南的条形全选上,只需要随便选中两个江西和河南,然后右键,点别针的图表,选上,六省,就行了。   这样,就看到,所有的江西和河南的条形图,都被算作了一个组;而且可以给这个江西&河南组以不同的颜色。

2016-08-31 00:30:37 16883

原创 tableau利用参数做动态图表,快速知晓数据概貌

比如,我们有一份样例数据,里面是各人在一段时间内查看汽车资讯的次数。 其中,只查看了一次的占绝大多数,查看了两次,3次,4次的递减。 那么我们把查看多少次,算作这些人群中比较‘关注’的人呢? 这时候,最好就是查看一下各个次数各有多少人,看看在人群中的占比。 如果一项一项的看又太不直观了,希望能一段一段的看,比如,10次一个步长,或者5次一个步长,或者100次算一

2016-08-30 14:54:54 11613

原创 tableau初步上手

http://www.36dsj.com/archives/42081 这个文章说,Tableau的得分是,A:Automation方面 6分Tableau的拖拽功能将做图分析的功能有效的自动化了。但是在数据获取和处理方面,他对数据质量和格式要求都非常高。B : Big Data方面 8分Tableau支持Hadoop,Spark等等。相比很多只支持cloud的startup, Tab

2016-08-30 14:38:24 1644

原创 一个APP用户的活跃情况,和下期活跃预测的例子

一,做流失预测的用处:•1.管理流失,提升留存/活跃率:①精确了解客户流失情况②分析流失和活跃客户特征③预测可能流失客户④制定相对应的个别或整体运营策略---尤其针对“高价值又即将流失”的宝贵用户群⑤实施运营策略并评估实际成果⑥重复1-5●•2.不仅仅可以预测流失,未来还可以建立模型来预测我们关注的其他事件,•比如“哪些人最有可能看教练视频?”•“那

2016-08-28 18:32:54 4552

原创 汽车行业的互联网营销业务目前有哪些种类

从汽车厂商来说,常见的的有几种:1. 媒体监测类需求:主要为了营销运营,我应该和哪些媒体合作?汽车资讯类站点主要的十来个,我应该怎么组合和覆盖才是投资回报率最高的?比如,易车和爱卡汽车在某种档次的车方面是不是潜客重叠度很高?那么我就不用两边都投了。又比如,汽车资讯的很多频道,有汽车配置页面,口碑页面,论坛,商城,广告,页面的流转如何。来源上有没有什么特点?也是展示广告投放需

2016-08-28 18:16:40 1760

原创 简单统计、数据处理的几个常用命令:频率统计,和key匹配

最近常用的几个数据处理的小技巧:1. python的collections模块的Counter方法,和shell命令的sort uniq -c 做的是相同的事情,都是日常处理非常常见的,需要统计一个集合中各个元素的出现次数。比如:对于一个列表test_list=[1,2,2,3,3,3,4,4,4,4,5,5,5,5,5,2,2,3,3],test_dict=dict(Coun

2016-08-28 17:22:23 784

原创 Mac下使用excel统计的几个坑

excel在windows下确实是数据处理的利器,可是到Mac下确实不敢深用了,还是用Python处理好以后,在excel里面也就简单看看罢了。1. 不区分大小写。这个谁用谁知道,刚开始简直不敢相信,后来一搜发现大家都在问,怎么让excel的字符串匹配变成大小写敏感。。。。。包括过滤器,如果要过滤a,那么包括a和A的字符串都会出现。如果用vlookup,也是一样。。。 虽然,如果你

2016-08-28 17:15:47 6953

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除