自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(20)
  • 收藏
  • 关注

转载 自制桌面小工具——石墨文档自动索引

现在线上协作大多需要使用诸如石墨文档或云协作这样的协同工具。进行社群运营工作时,由于文档太多,各人建立文件夹的方式又难以统一,因而产生文件多而乱的问题。为了快速地找到文件,除了使用石墨本身自带的搜索功能外,还可以对某一个目录下的全部文件生成索引。索引的格式如:目录一 链接一子目录A 链接A文件1 链接1文件2 链接2子目录B 链接B文件3 链接3文件4 链接4如需使...

2018-08-13 16:13:00 459

转载 学习笔记:【案例】财政收入影响因素分析及预测模型

案例来源:《Python数据分析与挖掘实战》第13章案例背景与挖掘目标输入数据:《某市统计年鉴》(1995-2014)挖掘目标:梳理影响地方财政收入的关键特征,分析、识别影响地方财政收入的关键特征的选择模型结合目标1的因素分析,对某市2015年的财政总收入及各个类别收入进行预测分析方法与过程(选择的原则)以往对财政收入的分析会使用多元线性回归模型,和最小二乘估计方法来...

2018-08-07 18:17:00 2375

转载 学习笔记:【案例】中医证型关联规则挖掘

案例来源:《Python数据分析与挖掘实战》第8章案例背景与挖掘目标输入数据:挖掘目标:借助三阴乳腺癌患者的病理信息,挖掘患者的症状与中医证型之间的关联关系对截断治疗提供依据,挖掘潜性证素分析方法与过程(选择的原则)子任务规划问卷形式收集原始数据数据预处理运用关联规则算法建模分析结果,应用到实际业务中实验实现Apriori关联规则算法读取数据 de...

2018-08-07 18:17:00 940

转载 学习笔记:【案例】航空公司客户价值分析

案例来源:《Python数据分析与挖掘实战》第7章案例背景与挖掘目标输入数据:航空信息数据表(客户基本信息 + 乘机信息 + 积分信息)挖掘目标:借助航空公司客户数据,对客户进行分类。对不同的客户类别进行特征分析,比较不同类客户的客户价值。对不同价值的客户类别提供个性化服务,制定相应的营销策略。分析方法与过程(选择的原则)调用CRM中的客户价值模型RFM模型的3个...

2018-08-07 18:15:00 1357

转载 学习笔记:【案例】电力窃漏用户自动识别

案例来源:《Python数据分析与挖掘实战》第6章案例背景与挖掘目标提取窃漏电用户的关键特征,构建窃漏电用户的识别模型,自动检查、判断用户是否存在窃漏电行为。输入数据:用电负荷数据终端报警信息违约、窃电处理通知书挖掘目标:归纳出窃漏电用户的关键特征,构建窃漏电用户的识别模型利用实时监测数据,调用窃漏电用户识别模型实现实时诊断分析方法与过程(选择的原则)数据预处理...

2018-08-07 18:14:00 221

转载 数据挖掘 案例一:电力窃漏用户自动识别

案例来源:《Python数据分析与挖掘实战》第6章案例背景与挖掘目标提取窃漏电用户的关键特征,构建窃漏电用户的识别模型,自动检查、判断用户是否存在窃漏电行为。输入数据:用电负荷数据终端报警信息违约、窃电处理通知书挖掘目标:归纳出窃漏电用户的关键特征,构建窃漏电用户的识别模型利用实时监测数据,调用窃漏电用户识别模型实现实时诊断分析方法与过程(选择的原则)数据预处理...

2018-03-21 14:49:00 1162

转载 Shiny学习实践01

Shiny是什么东东?官方描述:Shiny is an R package that makes it easy to build interactive web apps straight from R. You can host standalone apps on a webpage or embed them in R Markdown documents or build ...

2017-12-05 16:15:00 274

转载 171129-workaround on ubuntu-seting up piston for steem

setup ubuntu environment variablessudo vi /etc/environmentThen set all below variables:percentChanceToPostnumPostsToConsidervoteWeightsteemPostingKeysteemAccountNameerror encounter while ...

2017-11-29 17:37:00 111

转载 学习笔记 | 练习题 | 01

01 Consider the mtcars data set. Fit a model with mpg as the outcome that includes number of cylinders as a factor variable and weight as confounder. Give the adjusted estimate for the expected c...

2017-10-25 14:18:00 184

转载 学习笔记 | 回归模型 | 05 多变量回归分析

Multi-variable regression analyses如果现在我需要做一个薄荷糖和肺功能直接关系的研究,你可能会产生以下怀疑01 很可能你会认为:吸烟者更需要薄荷糖,吸烟者肺功能较弱,这很可能是主因02 什么说服你这样去想,你会说,如果说不吸烟的薄荷糖使用者的肺功能比不吸烟不吃薄荷糖的人低,同理,吸烟的薄荷糖使用者的肺功能也比吸烟不吃薄荷糖的人低,我会更容易相信你换...

2017-10-24 16:22:00 1544

转载 学习笔记 | 回归模型 | 04 残差波动

观测值与预测值之间的差就是残差,残差符合正态分布计算结果表明:Total Variation = Residual Variation + Regression Variation总波动(Y与Y均值的平方和[方差]) = 残差波动(Y与Y观测值的差的平方和) + 回归波动(Y观测值与Y均值的差的平方和)summary(fit) 中看到的R平方 = cor(Y,...

2017-10-19 10:42:00 632

转载 学习笔记 | 回归模型 | 03 最小二乘法

英国统计学家弗朗西斯·高尔顿提出的高尔顿定律,结论:身材较高的父母,他们的孩子也较高,但这些孩子的平均身高并没有他们的父母的平均身高高;身材较矮的父母,他们的孩子也较矮,但这些孩子的平均身高却比他们的父母的平均身高高。图形展示的结果如下:横坐标是父母的身高,纵坐标是孩子的身高。紫色小框的数据代表:父母矮,但孩子比父母高的部分绿色小框的数据代表:父...

2017-10-13 11:09:00 235

转载 学习笔记 | 回归模型 | 02 残差

Residuals 残差用最小二乘法提出两个等式残差和存在相互抵消的问题残差与预测变量相关(此为父母身高)也许回归模型的关键洞见是适合他们生产高度可翻译的模型。这是与机器学习算法,它常常牺牲可解释性改善预测性能或自动化。当然,这些都是有价值的属性在他们自己的权利。然而,简单的好处,吝啬和intrepretability回归模型(和他们的亲密归纳)应该使他们第...

2017-10-10 15:43:00 608

转载 学习笔记 | 回归模型 | 01 介绍

01 IntroductionRegression toward the mean 趋均数回归弗朗西斯·高尔顿他在论及遗传对个体差异的影响时,首次提到了相关系数的概念。比如他研究了“居间亲”和其成年子女的身高关系,发现居间亲和其子女的身高有正相关,即父母的身材较高,其子女的身材也有较高的趋势。反之,父母的身材较低,其子女也有较矮的趋势。同时发现子女的身高常与...

2017-10-09 14:56:00 172

转载 MSSQL数据库设置单用户模式后无法连上解决办法

设置数据库单用户模式后, 发现用系统管理员账号无法连接数据库, 用sa账号也不行.首先, 马上去查了一下有什么进程比这个连接给占用了SELECT [Spid] = session_Id, ecid, [Database] = DB_NAME(sp.dbid), [User] = nt_username, [Status] = er.status, [...

2016-10-20 09:54:00 505

转载 Kettle通用数据贴源作业设计

本设计基于以下需求提出1. 快速接入数据源表(贴源/落地)2. 无须给单独表开发转换/作业3. 动态生成数据源连接, 表字段等信息(预先保存在数据仓库中)本设计所需条件1. 数据源为关系型数据库2. 不同数据源需要写一小段Java Scripts以保证数据源连接可用总体作业结构jb_STG_SetVariable: 设置及生成后续转换所需信...

2016-10-11 10:04:00 223

转载 Kettle bug收集

20160919(未确定):加载表的使用"Use batch update for inserts"会引致奇怪的转换失败?出错日志:- linenr 450000- linenr 500000- ERROR (version 5.4.0.1-130, build 1 from 2015-06-14_12-34-55 by buildguy) : Because of a...

2016-09-19 10:07:00 885

转载 应用系统数据删除解决方案

需求:由于公司一些旧系统在开发上线时没有考虑到数据需要备份删除的问题, 导致系统使用了十年之后数据库过大, 需要进行紧急的实时备份删除数据1. 备份数据到备份库2. 删除数据3. 收缩数据库数据文件因为需要尽量减少对系统的影响, 一般会按一下步骤操作1. 如为系统不需要实时查询的表(如系统日志表), 则创建新表代替, 把旧表改成TableName_Old然后...

2016-09-14 10:26:00 260

转载 使用Kettle增量抽取MongoDB数据实践

需求: 增量抽取MongoDB数据并加载到MSSQL由于不能使用关系型数据库的自定义SQL, 所以主要遇到的问题有:增量时间的查询和参数控制ETL的批次信息和调用参数的写入第一个问题的解决如下:使用命名参数在Query页中进行过滤, 一开始会担心${}的引用方式会用Mongo的语法冲突, 测试后发现运行正常第二个问题:先为结果增加常量值...

2016-07-22 11:20:00 1415

转载 MSSQL_20160719_在作业步骤中使用sp_send_dbmail遇到的问题

需求:在作业步骤中使用sp_send_dbmail发出邮件, 并将数据库中的日志表通过@query参数导出文本作为邮件附件遇到错误:服务器 DB-DWH-1,第 1 行 服务器主体 "NT AUTHORITY\SYSTEM" 无法在当前安全上下文下访问数据库 "DW"。 [SQLSTATE 42000] (错误 14661). 该步骤失败。马上查了一下这个...

2016-07-20 09:24:00 305

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除