kate的博客

写作始于摹仿,多积累才能有突破,突破后方可以创造,创造什么呢?创造自己。...

mac系统 mysql 修改默认密码

mac系统 mysql 修改默认密码 注:mysql在mac下的路径是 /usr/local/mysql/bin 先在系统设置中关闭mysql服务(如果启动了mysql服务的话) 在终端使用命令sudo /usr/local/mysql/bin/mysqld_safe --skip-grant-...

2018-10-12 18:08:20

阅读数 108

评论数 0

pandas使用之宽表变窄表

import pandas as pd # 伪造一些数据 fake_data = {'subject':['math', 'english'], 'A': [88, 90], 'B': [70, 80], 'C': [60, ...

2018-10-07 00:16:17

阅读数 784

评论数 0

机器学习之欠拟合,过拟合

机器学习之欠拟合,过拟合

2018-09-25 14:14:47

阅读数 92

评论数 0

pytorch 笔记之squeeze

squeeeze使用 torch.squeeze(input, dim=None, out=None) → Tensor Returns a tensor with all the dimensions of input of size 1 removed. 简单来说,squee...

2018-09-07 22:23:19

阅读数 105

评论数 0

pandas 分组计数 取出前n条记录

pandas 分组计数 取出前n条记录 总的来说,两行代码即可搞定。 test_data.groupby('release_year')['genre'].value_counts() # output,结果为 Series release_year genre 196...

2018-09-06 22:22:12

阅读数 1854

评论数 0

Latex 公式换行 等号左对齐

Latex 公式换行 等号左对齐示例: \begin{equation} \begin{aligned} X^TXh - X^TY&= \begin{bmatrix} x_1 & x_2 & ... &am...

2018-08-20 23:43:04

阅读数 1075

评论数 0

tableau学习资源

Tableau官方推荐项目集 Tableau官方培训视频 Tableau官方在线指南 Udemy的Tableau相关课程 Coursera的Tableau专项课程 Coursera的Tableau单项课程 数据可视化博客VizWiz...

2018-08-18 09:18:26

阅读数 1084

评论数 0

ggplot2 包画分组 boxplot

## 对不同质量组的挥发性酸含量绘制箱线图 ## 叠加了散点图 和 每组数据的均值 library(ggplot2) ggplot(data=winered, aes(x = factor(quality), y = volatile.acidity)) + geom_jitter(alph...

2018-08-06 03:58:23

阅读数 2063

评论数 0

python 中 zip 的使用及 * 的使用

zip: 将相同维度的值合并在一起。 a = [10, 20] b = [3, 4] list(zip(a,b)) ## output [(10, 3), (20, 4)] 顺带说一下python中函数的参数 *args 的含义:让函数接受不定长参数。 dic = {'a':0, 'b...

2018-07-28 22:21:51

阅读数 159

评论数 0

R 探索多变量

3 4 Plotting Conditional Summaries pf.fc_by_age_gender ggplot(data = pf.fc_by_age_gender, aes(x = age, y = median_friend_count)) + geom_l...

2018-07-24 22:19:37

阅读数 148

评论数 0

R 画图遇到的问题

> ggplot(aes(x = age, y = friend_count), data = pf) + coord_cartesian(xlim = c(13, 90)) + geom_point(alpha = 1/20, positi...

2018-07-23 14:21:34

阅读数 105

评论数 0

R 分析两个变量

条件均值 install.packages('dplyr') library(dplyr) # 其中的常见函数 filter() group_by() mutate() arrange() 更多关于 dplyr 包的信息 Hadley Wickham 于 2014 年在 us...

2018-07-23 11:21:29

阅读数 354

评论数 0

R 频率多边形

# 改变y轴坐标,以频率作为标度 qplot(x = friend_count, y = ..count../sum(..count..), data = subset(pf, !is.na(gender)), xlab = 'Friend Count', ...

2018-07-22 19:33:52

阅读数 146

评论数 0

R 点重合处理,坐标变换

绘制散点图时,经常会有点过分重合的情况,为了更好地进行可视化,可以使用以下方法进行改善。 一. 设置透明度 ggplot(aes(x = age, y = friend_count), data = pf) + geom_point(alpha = 1/10) + xlim(13, 9...

2018-07-22 15:36:47

阅读数 219

评论数 0

R 分析单一变量 总结

查看单一变量 变量类型, 分布状态, 是否有缺失值和异常值。 可视化工具 直方图, 箱线图, 频数多边形。 调整 直方图组距, x轴,y轴的限制, 变量的对数变换, 变量的二进制变换。...

2018-07-21 18:19:47

阅读数 236

评论数 0

R 变量的逻辑转换

# 读取数据 pf <- read.csv('pseudo_facebook.tsv', sep = '\t') > summary(pf$mobile_likes) Min. 1st Qu. Median Mean 3r...

2018-07-21 17:53:06

阅读数 446

评论数 0

R install.packages() 设置国内CRAN镜像

使用 install.packages() 安装R包时,总是比较慢,有时甚至安装失败,失败情形如下: > install.packages('gridExtra') Warning in install.packages : unable to access i...

2018-07-20 22:45:22

阅读数 3440

评论数 1

R 中进行对数变换

R 中进行对数变换 说明:这篇文章是我在学习 R 时看到的,感觉很有用,就翻译了过来。原文:Log Transformations for Skewed and Wide Distributions —– 正文分割线 —– 当数据分布大致对称时,用均值和标准差对数据进行归一化是非常有意...

2018-07-20 18:59:14

阅读数 4003

评论数 0

R 中对数据进行汇总

f <- read.delim('pseudo_facebook.tsv') > summary(f) userid age dob_day dob_year dob_m...

2018-07-19 23:05:58

阅读数 215

评论数 0

R 笔记

top-coded

2018-07-19 18:56:20

阅读数 56

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭