自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 收藏
  • 关注

转载 Python 数据集的合并:merge 与 join

向大家介绍数据集处理过程中的“合并”方法:merge 与 join,为了更好的演示相关操作,需要做一些准备工作,包括导入所需的 Pandas 库与 Numpy 库,以及构建方便于结果展示的 display 类:import pandas as pdimport numpy as npclass display(object): """Display HTML representation

2017-02-24 10:54:40 26188

转载 使用 Pandas 分析网站访问日志

通过一个例子向大家演示如何运用 Pandas 来进行 Apache 访问日志分析。本文内容其实也是原作者对 Pandas 库的一次尝试。1、载入并解析数据在解析网站日志时需要用到 apachelog 模块 ,因此我们首先需要了解一下 Apache 配置中的日志相关格式,这里并不打算在这方面详细展开,如果你对此感兴趣的话,可以详细查阅一下 官方提供的格式描述。在此,我们对 Apache 配置格式进行一

2017-02-21 11:30:44 2193

转载 深度学习:基于 Gensim 的 Yelp 评论文本分类实例

通过 gensim 将词向量(Word2Vec)学习机运用于文本分类中,参考文献:Document Classification by Inversion of Distributed Language Representations(ACL 2015)。1、数据准备首先,我们需要到 kaggle 上的 Yelp recruiting contest 下载我们要用到的数据,可能需要注册并登陆自己的

2017-02-17 10:57:39 2204 1

转载 R 图表中的字体调整

在 R 中,如何调整图表中的字体呢?1、geom_text通过 ggplot2 包中的geom_text或是annotate命令,我们可以对图表文本中的一系列属性进行设置。geom_text通常用于将数据框中的文本加入图表,而annotate则用于往图表中添加一个独立的文本元素。需要注意的是字体的size是以 mm 为单位的,而非磅。dat <- data.frame( y = 1:

2017-02-14 10:50:36 16798

转载 Python 数据集处理之连接与追加

向大家介绍数据集合并方法中的连接(concat)与追加(append),首先做一些准备工作:1.导入 Pandas 库与 Numpy 库:import pandas as pdimport numpy as np2.定义一个 make_df 函数,以便生成示例数据框:def make_df(cols, ind): """Quickly make a dataframe""" dat

2017-02-10 11:04:17 8480

转载 如何设置 R 图像的点形状与线类型

参数及对应的标记形状如下:需要注意的是,如果我们输出的是位图,填充标记符号 15-18 可能在渲染后出现失真的情况,它们将会出现锯齿,像素化,并且无法居中,无论它们是否源自相同的绘制平台。而标记符号 19 和 21-25 在填充区域外部有一个边框,这在绝大多数绘制平台中会使得它们在渲染后具有一个相对平滑的边缘。如果我们想让标记符号 21-25 看起来实心,那么我们就需要将其填充色(bg)调整为与边框

2017-02-07 11:08:35 15712

转载 R 中将图表导出成文件

要特别强调的一点是,必须要使用 dev.off() 命令来告诉 R 我们已经完成绘图,否则我们的要保存的图像就不会出现

2017-01-24 10:39:33 10884 1

转载 Python 中多层级数据的生成与索引

Python 中多层级数据的生成与索引方法基于 Pandas 和 Numpy 中的一些功能,首先我们需要导入这两个库:import pandas as pdimport numpy as np我们知道,Pandas 序列中的序号序列 index 是一个列表,这个列表可以由多个二元组构成,如下所示:index = [('California', 2000), ('California', 2010)

2017-01-20 10:54:21 2752

转载 ggplot2 调整图像颜色

在 R 中,如何使用 ggplot2 来调整数据图像中的颜色?另外,ggplot2 中默认的颜色配置都具有相等的亮度,这有时会使得色块间难以区分,对于色盲朋友们来说是十分不友好的。为了解决这个问题,最好是调用一个具有“色盲模式”的调色板,下面将告诉大家如何做到这一点。

2017-01-19 11:36:59 46580

转载 Python 中的缺失值及其处理

缺失值处理用到的主要工具为 Numpy 库和 Pandas库中的有关函数,要导入 Numpy 和 Pandas:import numpy as npimport pandas as pd在 Python 中,特殊的常量 None 通常被理解为缺失值的一种,我们构建了一个包含有 None 的 Numpy 数组 vals1:vals1 = np.array([1, None, 3, 4])vals1

2017-01-18 13:49:39 12371

转载 ggplot2 一页多图

ggplot2 一页多图通过构建multiplot函数,能够很容易地做到一页多图,该函数的具体定义附在末尾,如果它并不能完全满足你的需求,可以复制它并在它的基础上进行修改。首先,构建一系列图像,但不直接去渲染它们,图像的具体细节并不重要,我们只需要将这些图像对象全部存储为变量。library(ggplot2) # 下面的例子用到了ggplot2包中自带的示例数据集ChickWeight

2017-01-17 11:25:01 4144

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除