- 博客(135)
- 收藏
- 关注
转载 统计学知识6:逻辑回归的极大似然求解(梯度下降实现)
逻辑回归的极大似然推导:由于似然函数是样本的函数,需要知道其分布,并且假设相互独立。上述公式就推导出梯度下降更新的方向梯度更新的方法:逻辑回归编程实现(按步骤手工编程)假设我们有一个数据,共有100个样本,含两个x变量,x1、x2,一个目标变量y。数据如下:我们的目标是求出参数θ0、θ1、θ2。步骤1:定义sigmoid函数logistic转化成预测概率。步骤2:定义线性回归函数z的表达式步骤3:
2017-11-19 00:00:00 3636
转载 VBA案例8:实现在ppt中写vba,控制动态图
在幻灯表播放时,数据会变动需要在ppt中,先插入一个excel对象,在其中编辑数据,做成动态图,然后将ppt上的控件,链接到excel中,即可在ppt放映时,自动筛选数据。程序内容:
2017-11-15 00:00:00 9140
转载 VBA案例4:取文件夹中所有文件的名称
取文件夹中所有文件的名称,存在在excel中程序案例:程序案例:Private Sub CommandButton1_Click()Application.ScreenUpdating = FalseApplication.DisplayAlerts = Falsetemp = ThisWorkbook.Path '设定路径objectname = ThisWorkbook.Name '目标文件名
2017-11-15 00:00:00 5244 1
转载 VBA案例7:自动生成透视表
自动生成透视表程序案例:文本型:Private Sub CommandButton2_Click()Sheet5.Cells.ClearDim WS As WorksheetDim NewWS As WorksheetDim SourceRange As RangeDim NewRange As RangeDim PTC As PivotCacheDim PVT As PivotTableSet
2017-11-15 00:00:00 7536 1
转载 VBA案例10:其他案例(自动填写公式、合并多个sheet等)
1、自动填写公式2、打开文件时下拉框中有内容需要把下面的内容写在thisworkbook中3、合并同一个工作簿中所有的文件。4、自动创建目录。5、删除工作表中的空行。6、删除工作表中的重复行。
2017-11-15 00:00:00 1268
转载 VBA案例3:合并多个结构相同的文件
有多个结构相同的文件,需要合并到一张表中,如截图中一个文件夹中的文件1、文件2,合并为最终的输出结果:其结构均相同,如下:合并后的结构也是如此。合并提示如下:程序代码:程序代码:Private Sub CommandButton1_Click()Dim wb As WorkbookDim str As StringDim strr As StringDim Str2 As StringDim co
2017-11-15 00:00:00 675
转载 Python基础知识6:格式化字符、颜色
字符格式化,有两种方式:1、通过%占位符方式,%s,%d,%2、通过format,其中format比较好用,可以居中、可以用%、可以用二进制、可以填充字符自定义;1、利用%的案例tp1="i am %s"%"aaa"#tp2="i am %s age %d"%("alex",18)#顺序关联tp3="i am %(name)s age %(age)d"%{"name":"alex","age":1
2017-11-13 00:00:00 768
转载 信用评分卡总结11:模型检测报告、学习资料来源
在评分卡实施之前和之后,都需要连续编制大量的报告,以评价评分卡的表现。这些报告可以分为两类。实施前报告:通常,这些报告被用来计算得分在不同变量的范围和类别之间的分布。它们还可以用来比较这些变量分配的分值和观测到的违约率。实施后报告:这些报告的重点是评估评分卡在防止违约率以及被赋予的分值。通常,评分卡被认为是帮助企业回答以下问题的工具:1、如何将评分卡与企业的总体
2017-11-11 00:00:00 2157
转载 信用评分卡模型总结9:评分卡生成及sas实施
1、标准评分卡的格式 标准评分卡采用的格式是评分卡中的每一个变量都遵循一系列IF-THEN法则。数据记录中每一个变量的值都适用此法则的结果决定了该特定变量所分配的分支,总分就是评分卡中所有变量的贡献的和。 假设评分卡用到三个特征变量: a:账户持有人的年龄 b:在当前住址的居住年限 c:就业状况 标准评分卡
2017-11-11 00:00:00 5868 1
转载 信用评分卡模型总结10:评分卡的创建及sas部署实施
创建评分卡的基本过程可以总结为以下几个步骤。确定最终评分卡将被纳入模型的变量使用WOE值和模型参数,为不同变量的每一类或每一段相应的分配分值。模型的截距项用于计算评分卡的基准点。每个变量类别或分段分配的分值都根据对应的变量取值范围制成表格。为了便于实施,经常要将评分卡表现为某种程序的形式。流行的实施语言是sas,sql和c。 sas实施过程
2017-11-11 00:00:00 4376
原创 Boosting:XGBoost思想及数据推导详细过程
Boosting思想: Boosting主要是一种思想,表示“知错就改”。是一族可将弱学习器提升为强学习器的算法,如Adaboost、GBDT、XGBOOST,这组算法的工作机制类似。先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个学习器,如此重复进行下去,直到基学习器
2017-11-08 00:00:00 4091 2
原创 集成学习思想以及boosting、bagging介绍
人们在做重大决定的时候,可能都会考虑吸取多个专家,而非一个人的意见,机器学习处理问题时,也是如此,采用集成的思想,相信“三个臭皮匠,顶个诸葛亮”1、集成学习(ensemble learning): 1)基础介绍 集成算法,把大大小小的多种分类器融合在一起,共同协作来解决一个问题。充分展示“集体智慧”,“博采众长”思想。集成学习的一般结构,先产生一组个体学习器
2017-11-08 00:00:00 1035
原创 Boosting:AdaBoost理论知识
Boosting思想: Boosting主要是一种思想,表示“知错就改”。是一族可将弱学习器提升为强学习器的算法,如Adaboost、GBDT、XGBOOST,这组算法的工作机制类似。先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器做错的训练样本在后续受到更多关注,然后基于调整后的样本分布来训练下一个学习器,如此重复进行下去,直到基学习器
2017-11-08 00:00:00 470
原创 Bagging:随机森林及Python实现
随机森林是bagging的代表1、bagging: bootstrap sampling:自助采样法。给定包含m个样本的数据集,我们先随机取出一个样本放入采样集中,再把该样本放回初始数据集,使得下次采样时,该样本仍有可能被选中,这样,经过m次随机采样操作,我们得到含m个样本的采样集,初始训练集中有的样本在采样集里多次出现,有的则从未出现,初始训练集约有63.2%的样本出现在采样集
2017-11-08 00:00:00 3226
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人