自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(12)
  • 收藏
  • 关注

转载 数据类型操作简单对比(R和Python)

一、R方面R中类型:向量(vector)、数据框、矩阵、列表数据处理转换时:数值型num、因子(factor)、字符型等等1)matrixfeature:1、二维数组2、每个元素必须有相同的数据类型create:matrix(vector, nrow = number_of_rows, ncol = number_of_columns, byrow = T/F...

2019-09-28 07:44:00 268

转载 数据处理pandas

1、缺失值时间戳不为NaN,为NaT, 同样判断都为isna()或notna()方法2、删值\去重df.dropna()df.drop_duplicates()3、上下值插值df.fillna(method='pad') # 插取上面的值 可带参数limit = df.fillna(method='bfill') # 插取下面的值 同时可有limit参数表...

2019-09-28 07:12:00 153

转载 爬虫爬取幽默笑话

爬取网站为:http://xiaohua.zol.com.cn/youmo/查看网页机构,爬取笑话内容时存在如下问题:1、每页需要进入“查看更多”链接下面网页进行进一步爬取内容每页查看更多链接内容比较多,多任务进行,这里采用线程池的方式,可以有效地控制系统中并发线程的数量。避免当系统中包含有大量的并发线程时,导致系统性能下降,甚至导致 Python 解释器崩溃,引入线程池,花费时...

2019-09-17 08:00:00 298

转载 段子(未成年勿入)

领导儿子爱说谎。为此领导买一测谎机器人。是日儿晚归。父:去哪了?儿:图书馆。机器人一巴掌掴过去。儿:去同学家看黄片了。父:胆子好大,我长这么大从未看过。机器人随即给其父一巴掌。母怒斥父说:活该,对儿子这么苛刻。怎么说他都是你亲生的呀!啪!机器人又给其母一大耳光。爷孙三人去钓鱼,爷爷拿着鱼杆发呆,孙子看到后对爸爸说:瞧瞧,你爹在那发呆,跟傻X似的。爸爸打了儿子一耳光生气的喊道:你爹才傻...

2019-09-12 15:19:00 1057

转载 客户主题分析(tableau)—客户留存

客户留存分析(客户漏斗分析),关键在于找到影响客户留存的因素,设计场景测试,验证关键因素。即可以通过关键因素影响留存,从而重塑客户漏斗到更有价值的形状。案例:母婴产品客户留存分析数据结构:1)构建用户注册日期对用户购买时间的条形图新增计算字段:购买点会员生命期(月)其计算公式为:销售日期和会员创建日期的差值,以月份为单位datediff('...

2019-09-12 11:57:00 708

转载 数据库练习

(题目来自力扣)1、编写一个 SQL 查询,获取 Employee表中第二高的薪水(Salary)。+----+--------+| Id | Salary |+----+--------+| 1 | 100 || 2 | 200 || 3 | 300 |+----+--------+例如上述Employee表,SQL查询应该返回200 作为第二...

2019-09-10 14:10:00 231

转载 R分析实现对招聘网站薪资预测分析

1、首先确定数据分析目标——薪酬受哪些因素影响确定变量:因变量:薪资自变量:(定性)-- 公司类别、公司规模、地区、行业类别、学历要求、软件要求、    (定量)-- 经验要求(数值型)分析目标:建立因变量和自变量的多元线性回归模型,估计模型系数,检验系数显著性,确定自变量是否对因变量有影响。并实现自变量新值带入实现模型预测。2、数据预处理。(整理数据,使其成...

2019-09-09 09:27:00 3975

转载 GUI(Graphical User Interface)

译:用户和图形界面GUI与程序交互的不同方式,包含3基本要素:输入,处理和输出。常用GUI框架包括以下几种:wxPythonKivyFlexxPyQtTkinterPywin32PyGTKpyui4win熟悉PyQt框架:安装 pip install pyqt5使用第三方工具Qt配合使用,Qt创建项目时自动生成的的.ui文件,需...

2019-09-01 19:18:00 307

转载 tableau 和 R 的连接

1、安装R包Rserve2、tableau帮助-管理外部服务连接,单击测试按钮出现成功连接即是通信成功。  3、创建新工作表,设置id字段,针对id记录数创建计算字段Rrand。将Rrand拖入行维度上id的后面,运算后会得到R返回的随机数。更高的要求:只有当R返回的记录数和输出的记录数相匹配时,才能正确输出通信数据,但对于一些复杂处理,比如使用构建...

2019-09-01 08:59:00 250

转载 客户主题分析(tableau)—客户分群

主要分析方面:客户合理分群客户分群实现:使用聚类构建指标,需理解聚类的分析逻辑,需使用软件:tableau聚类方法:选择3指标分别为购买总金额,客户购买次数、类平均购买价格(四类的平均购买价格,四类字段列进行avg聚合)类平均购买价格:计算消费数据中所以四级品类消费金额的平均值,等于为每个品类构造了一个数值标签字段,在聚类中使用了按会员计算这个字段的均值,购物品种结构越接近,...

2019-08-31 18:20:00 952

转载 类和对象

1、Python中面向对象程序设计特点:封装、继承和多态关于继承:可以打个形象的比方矩形、菱形、平行四边形和梯形等都是四边形,以平行四边形为例,如果把平行四边形看成四边形的延伸,那么平行四边形就复用了四边形的属性和行为,同时添加了平行四边形特有的属性和行为,如平行四边形的对边平行且相等。---->在Python中可以把平行四边形类看作是继承四边形类后产生的类,其中,将类...

2019-08-19 07:39:00 124

转载 最小二乘拟合(scipy实现)

Scipy库在numpy库基础上增加了众多数学,科学及工程计算中常用库函数。如线性代数,常微分方程数值求解,信号处理,图像处理,稀疏矩阵等。如下理解通过Scipy进行最小二乘法拟合运算最小二乘拟合(optimize子函数)from scipy.optimize import leastsqoptimize函数含有实现最小二乘法的函数 leastsq,如下通过对正弦函...

2019-08-04 14:38:00 491

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除