自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (2)
  • 收藏
  • 关注

原创 直击痛点:一招搞定GitHub开源项目下载加速!

我们都知道github是一个巨大的开源宝库,上面有非常多的优质项目,我们经常需要去上面下载优秀的项目来进行学习或者科研等等。但是啊,我们经常遇到一个痛点,就是在clone的时候,下载速度太慢了,经常就就几kb不超过30kb,那么有什么办法能够搞定github开源项目的下载速度呢,今天,他来了。

2020-05-09 13:44:43 14947 66

原创 【干货满满】,有他就够了,推荐一神奇的链接

给大家推荐一个Github,上面非常非常多的干货,保证让你满意:https://github.com/XiangLinPro/IT_book

2020-05-01 01:13:45 10399 32

原创 第9章 pandas时序数据(初学者必学)

在拿到一份数据准备做挖掘建模之前,首先需要进行初步的数据探索性分析,对数据探索性分析之后要先进行一系列的数据预处理步骤。因为拿到的原始数据存在不完整、不一致、有异常的数据,而这些“错误”数据会严重影响到数据挖掘建模的执行效率甚至导致挖掘结果出现偏差,因此首先要数据清洗。数据清洗完成之后接着进行或者同时进行数据集成、转换、归一化等一系列处理,该过程就是数据预处理。一方面是提高数据的质量,另一方面可以让数据更好的适应特定的挖掘模型,在实际工作中该部分的内容可能会占整个工作的70%甚至更多。

2020-05-30 17:15:42 3165 29

原创 第8章 pandas分类数据(初学者必学)

在拿到一份数据准备做挖掘建模之前,首先需要进行初步的数据探索性分析,对数据探索性分析之后要先进行一系列的数据预处理步骤。因为拿到的原始数据存在不完整、不一致、有异常的数据,而这些“错误”数据会严重影响到数据挖掘建模的执行效率甚至导致挖掘结果出现偏差,因此首先要数据清洗。数据清洗完成之后接着进行或者同时进行数据集成、转换、归一化等一系列处理,该过程就是数据预处理。一方面是提高数据的质量,另一方面可以让数据更好的适应特定的挖掘模型,在实际工作中该部分的内容可能会占整个工作的70%甚至更多。系列文章第1章.

2020-05-27 18:08:36 3332 17

原创 第7章 pandas文本数据(初学者需要掌握的几种基本的数据预处理方法)

在拿到一份数据准备做挖掘建模之前,首先需要进行初步的数据探索性分析,对数据探索性分析之后要先进行一系列的数据预处理步骤。因为拿到的原始数据存在不完整、不一致、有异常的数据,而这些“错误”数据会严重影响到数据挖掘建模的执行效率甚至导致挖掘结果出现偏差,因此首先要数据清洗。数据清洗完成之后接着进行或者同时进行数据集成、转换、归一化等一系列处理,该过程就是数据预处理。一方面是提高数据的质量,另一方面可以让数据更好的适应特定的挖掘模型,在实际工作中该部分的内容可能会占整个工作的70%甚至更多。

2020-05-24 13:55:47 3178 25

原创 面试常考:排序算法(希尔排序)

借鉴插入排序的思想,优化之后的移位希尔排序法,目前来看效率是最高的!一直强调,算法无论简单与否,进行优化的思考过程是最重要的!

2020-05-23 23:39:29 3766 20

原创 我去,你竟然还不会插入排序

排序算法是最常见的笔试题目,几乎所有的笔试和面试都会考到,因为它体现的就是程序员的算法基础。可惜的是,作为一名菜鸟,,这方面的修养还真是不足,所以,在这里整理一下自己收集到的排序基础知识,以备需要的时候可以查阅。

2020-05-23 12:12:10 2626 18

原创 第6章 pandas缺失数据(初学者需要掌握的几种基本的数据预处理方法_缺失)

在拿到一份数据准备做挖掘建模之前,首先需要进行初步的数据探索性分析,对数据探索性分析之后要先进行一系列的数据预处理步骤。因为拿到的原始数据存在不完整、不一致、有异常的数据,而这些“错误”数据会严重影响到数据挖掘建模的执行效率甚至导致挖掘结果出现偏差,因此首先要数据清洗。数据清洗完成之后接着进行或者同时进行数据集成、转换、归一化等一系列处理,该过程就是数据预处理。一方面是提高数据的质量,另一方面可以让数据更好的适应特定的挖掘模型,在实际工作中该部分的内容可能会占整个工作的70%甚至更多。

2020-05-22 22:19:50 2858

原创 我用一张图彻底理解了冒泡排序

本博文介绍最常被提起的排序算法:冒泡排序。冒泡排序是入门排序算法,思路比较常规,但确是最耗时的排序算法,所以听到冒泡排序笑一笑就好了,千万不要拿来装B。

2020-05-19 23:22:30 457 14

原创 第5章 精通pandas合并操作(使用pandas进行数据分析,从小白逆袭大神,你会了吗?)

文章目录第5章 合并一、append与assign1. append方法2. assign方法二、combine与update1. comine方法2. update方法三、concat方法四、merge与join1. merge函数2. join函数第5章 合并import numpy as npimport pandas as pddf = pd.read_csv('data/table.csv')df.head()一、append与assign1. append方法(a)利用序列添

2020-05-18 23:33:07 455

原创 通俗易懂讲解 [图解]选择排序

文章目录1.选择排序2. 图示过程3.动图展示4.约定5.过程6.代码1.选择排序从数组中选择最小元素,将它与数组的第一个元素交换位置。再从数组剩下的元素中选择出最小的元素,将它与数组的第二个元素交换位置。不断进行这样的操作,直到将整个数组排序。选择排序需要 ~N2/2 次比较和 ~N 次交换,它的运行时间与输入无关,这个特点使得它对一个已经排序的数组也需要这么多的比较和交换操作。2. 图示过程3.动图展示4.约定待排序的元素需要实现 Java 的 Comparable 接口,该接口有 c

2020-05-15 21:28:38 4998 15

原创 第4章 精通pandas变形操作(使用pandas进行数据分析,从小白逆袭大神,你会了吗?)

文章目录第4章 变形一、透视表1. pivot2. pivot_table3. crosstab(交叉表)二、其他变形方法1. melt2. 压缩与展开三、哑变量与因子化1. Dummy Variable(哑变量)2. factorize方法Python火了,作为一门万能语言,Python迷人之处在于非常高效。在日常工作中,很多琐事都是要重复操作的,重复的工作会将你留个自己思考进步的时间都会占用,从而成为一个职场螺丝钉。而Python自动化办公,可以轻松将工作中繁杂且重复的内容通过简短的代码让计算机自动

2020-05-14 23:47:35 561

原创 如何高效地在网上找开源项目做!

现在大家找工作都面临一个问题,哎,没有项目经验怎么办,这个时候就需要我们找到一个开源项目来练练手,吸收成长,那怎么样才能找到一个好的开源项目让我们去学习,成长呢,今天,他来了。

2020-05-08 23:11:07 5849 14

原创 第3章 Pandas 分组(使用pandas进行数据分析,从小白逆袭大神,你会了吗?)

文章目录第3章 分组一、SAC过程1. 内涵2. apply过程二、groupby函数1. 分组函数的基本内容:2. groupby对象的特点三、聚合、过滤和变换1. 聚合(Aggregation)2. 过滤(Filteration)3. 变换(Transformation)四、apply函数1. apply函数的灵活性2. 用apply同时统计多个指标第3章 分组import numpy as npimport pandas as pddf = pd.read_csv('data/table.cs

2020-05-08 19:39:35 1094

_微软常用运行库合集_2019.07.20_X64.zip

 微软常用运行库合集是采用microsoft visual studio 20xx编写的软件必须使用的公用dll运行库,是目前为止最全最新的运行库集合,相当于程序的字典文件。 某些网上和论坛的部分精简软件没有附带这些公用dll,所以安装这些运行库是系统安装后第一件要做的事情。所有的安装文件全部来自微软官方网站,且为最新数字签名版本。

2020-04-18

泰坦数据.zip泰坦尼克号

影响乘客生还的因素很多,这里只对乘客的性别、年龄、乘客等级、这三个因素感兴趣, 看看这四个因素是否会影响乘客的生还率。 1.性别是否会影响生还率 2.年龄是否会影响生还率 3.乘客等级会否会影响乘客率 4.性别和舱位共同对生还率的影响 5.年纪和性别共同对生还率的影响 6.年纪和等级共同对生还率的影响 这里。乘客的性别、年龄、等级、是三个自变量,生还率是因变量

2020-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除