自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

hello world!

加油

  • 博客(12)
  • 收藏
  • 关注

原创 R语言基础

apply : 用于遍历数组中的行或列,并且使用指定函数来对其元素进行处理。 lapply : 遍历列表向量内的每个元素,并且使用指定函数来对其元素进行处理。返回列表向量。 sapply : 与lapply基本相同,只是对返回结果进行了简化,返回的是普通的向量。 mapply: 支持传入两个以上的列表。 tapply: 接入参数INDEX,对数据分组进行运算,就...

2018-05-30 14:35:47 1516

原创 数据透视表pivot_table,和crosstab()

很少使用数据透视表,在pandas中一般用groupby来处理问题,其实有些情况下使用pivot_table()来处理问题会更加方便。 先看看pandas的官方的文档:pandas.pivot_table 另外,这篇文章讲得更详细。...

2018-05-21 16:42:37 1477

原创 机器学习的好文

使用sklearn做单机特征工程 使用sklearn优雅地进行数据挖掘

2018-05-21 15:01:55 227

原创 sql中的窗口函数、用户变量和存储过程

窗口函数,也可以被称为OLAP函数或分析函数。mysql之前并不支持窗口函数,但也可以用其他方法实现,但mysql8.0是有窗口函数的,可以看看这篇文档。

2018-05-20 23:35:51 1404

原创 如何使用sklearn对决策树进行可视化

在sklearn的官网上已经对决策树的实现进行了详细介绍,这里主要讲一下可视化的过程。安装和配置GraphViz首先去下载软件,我的版本是graphviz-2.38.msi。然后就是配置环境变量,把\bin文件夹放到path中就行了。最后在终端命令行中输入:dot -version,检测一下有没有设置成功。决策树可视化需要安装一些python库,如graphviz等。 ...

2018-05-18 13:14:17 5441

原创 mysql的full join的实现以及join中的on条件的使用

在mysql里是不支持full join的。但是可以通过以下方式来实现: 左连接+ union+右连接 另外: union 操作符选取不同的值,会自动去重。如果允许重复的值,请使用 union all。...

2018-05-11 16:11:04 5151

原创 信用评分卡

传统的信贷模型以评分卡为主,了解一下。 这里有几篇关于评分卡的文章,可以看一下。参考文章

2018-05-09 17:03:51 784

原创 awk,了解一下!

虽然工作中用不上linux,但自己也学过一段时间的linux,竟然没听说过awk。这里放一些教程。 awk,了解一下! 这个教程写得挺好,可以点一下: 参考文章...

2018-05-08 18:09:06 180

转载 mysql的优化

一、前提 这里的原则只是针对MySQL数据库,其他的数据库某些是殊途同归,某些还是存在差异。我总结的也是MySQL普遍的规则,对于某些特殊情况得特殊对待。在构造SQL语句的时候要养成良好的习惯。二、原则总结 原则1、仅列出需要查询的字段,这对速度不会明显的影响,主要是考虑节省应用程序服务器的内存。原来语句:select * from admin优化为: select admin_i...

2018-05-08 10:15:18 163

原创 sorted的巧妙用法

如果要对一个整数序列中奇数和偶数单独排序,如下所示:a = [2, 3, 5, 4, 22, 45, 99, 16]#结果:[3, 5, 45, 99, 2, 4, 16, 22]b = sorted(a, key=lambda x: (x+100000) if x%2==0 else x)print(b)这里的key就是排序条件, 我们可以给lambda函数赋予不同的映射,如当元素...

2018-05-07 23:31:50 1600

转载 svm

惊呼——SVM支持向量机三重境界!

2018-05-07 11:52:13 592

原创 Hbase入门

大数据框架比较多,之前学了一些hive,由于它存在响应慢,不支持事务等缺点,所以我还得了解一下hbase。先看看别人总结的东西HBase详细概述 HBase 深入浅出...

2018-05-03 14:57:40 186

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除