自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 python学习笔记—jupyter进程管理

--------仅用于个人学习知识整理和R语言/python代码整理--------本文所使用数据全为脱敏模拟数据1.前言当后台有较多jupyter进程后,手工清理比较费时间,2.第一版本这个版本有一个问题在于,想要传导用户名作为命令行参数,使用{}并没有成功,,最后只在grep的地方直接写了用户名解决,并不能传导参数,这点欢迎大家和我讨论class processHandler(): def _init_(self): self.kill_id=[] ##查看

2020-08-19 11:59:18 920 2

原创 机器学习---决策树之画图

sklearn机器学习—决策树之画图--------仅用于个人学习知识整理和R语言/python代码整理--------本文所使用数据全为脱敏模拟数据1.前言项目中会需要对决策树的树图进行修改,看起来更方便(相当于要对比每个节点1的概率,和基础的1的概率之间的lift提升),此处特别感谢某团初始代码思路提供,之后代码基于某团思路修改2.二分类tree 增加lift及1 rate1. 画图code核心思路是替换export_graphviz中,树的结构,加入新计算的lift和1的比例,以下改编

2020-06-08 11:44:35 1543

原创 python学习笔记---linux/windows调用sas程序

python学习笔记—linux/windows调用sas程序仅用于个人学习知识整理和sas/R语言/python代码整理--------文章使用数据都为脱敏模拟数据--------文章首发于我的知乎:https://zhuanlan.zhihu.com/p/883010691.windows下1.1 安装sas kernel:跑偏了一下 其实不用装sas_kernel的,这个是要在...

2019-10-24 15:49:06 1191

原创 r语言学习笔记---radiant包

r语言学习笔记—radiant包--------仅用于个人学习知识整理和sas/R语言/python代码整理--------文章使用数据都为脱敏模拟数据--------文章首发于我的知乎:https://zhuanlan.zhihu.com/p/86306521简介radiant是r的包,基于r shiny开发,可以对数据进行简单的分析,进阶可以进行统计建模分析,并支持报表输出rad...

2019-10-24 10:14:50 1249

原创 python学习笔记---字符串/列表积累

python学习笔记—字符串/列表积累--------仅用于个人学习知识整理和sas/R语言/python代码整理利用列表循环 批量重命名列字符串反转string[::-1]

2019-09-27 15:04:10 156

原创 业务相关--vintage

vintage整理--------仅用于个人学习知识整理和sas/R语言/python代码整理####1 . 前言Vintage表,将不同时间层面的顾客拉平到同一时间周期上进行比较,观察不同入口时间的顾客在不同生命周期上的表现。vintage一般有三种用法:1.横看:得到同一时间入口的顾客,在不同生命周期上回来购买的表现2.竖看:不同时间如克客人质量的差别3.斜看:可以直观地看出不...

2019-09-15 23:05:44 1782

原创 机器学习-神经网络

机器学习-神经网络--------仅用于个人学习知识整理和sas/R语言/python代码整理1.前言神经网络,类似于人的大脑神经突触的结构,是由大量的节点(神经元)之间相互连接构成的一种运算模型。神经网络的结构类似下图(图片来自于scikit-learn官网)其原理是,对输入的变量features(input layers),建立n层的隐藏层(hidden layers),按顺序建立输...

2019-08-25 23:25:24 330

原创 机器学习--聚类分析

####层次聚类###聚类#根据correlation 用kmeans 对变量聚类import scipy.cluster.hierarchy as shcfrom scipy.cluster.hierarchy import dendrogram, linkagefrom sklearn.cluster import AgglomerativeClusteringimport mat...

2019-07-08 23:08:36 801

原创 python学习笔记---udf的使用

python学习笔记—udf及Lambda表达式--------仅用于个人学习知识整理和sas/R语言/python代码整理在spark sql中,可以使用udf(用户自定义函数)来把python函数转化为udf进行运算,下面直接上例子们吧!直接运用在列中from pyspark.sql.functions import udf ###python函数 定义def sum_fuc...

2019-05-20 23:15:41 4735

原创 统计分析--对应分析

统计分析–对应分析sas/r实现--------仅用于个人学习知识整理和sas/R语言/python代码整理1.前言对应分析,主要适用于有多个类别的分类变量,可以揭示同一个变量各个类别之间的差异,以及不同变量各个类别之间的对应关系(简介摘录自:https://www.jianshu.com/p/77a0d15f0336)以下通过实际例子 使用sas及r语言 进行实现,以及附上对应分析图的...

2019-05-19 20:24:19 6133 1

原创 机器学习---决策树

spark机器学习—决策树--------仅用于个人学习知识整理和R语言/python代码整理1.前言近期项目用到了spark环境下的决策树,并且使用r和python的ml下的函数,在回来的时候学习了python sklearn包。并且ml下画图及找到上级节点并不方便(如有方便的方法请告知我!),加上一些自己写的寻找上级节点的code2.R部分代码实现1. 建模及存储模型部分这部分...

2019-05-12 20:27:19 272

原创 sas学习笔记

sas个人学习笔记1.允许中文名 启用压缩OPTION compress=yes;OPTION validvarname=any;2.读取同一目录下的相同名字的数据data datapath.trans_all(drop=productname floor rename=(pname=productname));set datapath.trans_all_: indsname=...

2019-03-23 15:39:37 2058

原创 统计分析---多重共线性

多重共线性基础知识

2016-11-11 16:12:06 3466

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除