学习笔记
文章平均质量分 93
Escher_fu
Python/R/数据分析/机器学习/统计学
展开
-
Pandas数据预处理与数据重塑案例
Pandas数据预处理与数据重塑案例前言 预处理是数据分析中不可缺少的一部分,我们日常得到的数据多半是规整的,只有得到想要的相应格式的数据,才能进行后续的探索性分析和建模。以下是我在一个小的项目中部分数据预处理的过程,在这里记录下来方便我后续查看,也希望能给刚入门pandas的朋友们提供一些帮助。 本案例内容主要使用python的pandas进行操作,涉及知识包括数据框的增删查改、...原创 2018-09-16 20:25:52 · 3353 阅读 · 1 评论 -
Reverse+Data+Frame
Python随机数生成与对数据框的逆序排列(Reverse Pandas Data Frame) 在网上看到了Erik Marsja博客中提到对数据框进行逆序排序的方法,受益匪浅,于是通过以下笔记记录了reverse的内容和注释方便查阅,顺便简单介绍numpy中的两种生成随机数的方法。具体参见Erik的博客生成随机数 numpy的random模块中有很多生成随机数...翻译 2018-09-15 14:41:17 · 362 阅读 · 0 评论 -
笔记——Numpy基础
Numpy基础前言 最近感觉脑力日渐退化,很多基础的东西都记不清了,于是打算刷一下《利用python进行数据分析》这本书,看了一部分发现有很多东西以前学的时候也被遗漏了,果然还是需要补一下。 于是在这里对书中感觉重要、又记忆不深刻的东西做了下笔记,方便以后查阅。以下涉及到的是书中第四章关于numpy的基本操作,以下笔记只包括了我个人不熟练的内容,如果有朋友想系统地学习相关知识地话建议直接...原创 2018-09-28 14:46:59 · 202 阅读 · 0 评论 -
Python类别变量处理
Python类别变量处理Categorical Encoding Methods categorical feature(类别变量)是在数据分析中十分常见的特征变量,但是在进行建模时,python不能像R那样去直接处理非数值型的变量,因此我们往往需要对这些类别变量进行一系列转换,如哑变量或是独热编码。 在查找后发现一个开源包category_encoders,可以使用多种不同的编码技术把...原创 2018-10-30 15:31:09 · 8995 阅读 · 1 评论 -
小工具:使用python群发邮件
小工具:使用python群发邮件在小工具这个系列里记录一些我使用简易代码实现的一些小功能,方便自己在以后有需求的时候查看和调用,同时会讲解这些小功能实现实现过程,基础向,有需求或者感兴趣的朋友不妨上手试试。涉及包及项目结构介绍本次介绍的是使用python实现群发邮件的一个小功能,其中使用到的包及其功能如下:configparser:读取配置文件email:管理电子邮件消息smtpli...原创 2018-11-16 21:49:55 · 305 阅读 · 0 评论