Jupyter Notebook
Rich Dad
你若盛开,蝴蝶自来
展开
-
NumPy数组的高级操作(二)
@R星校长第2关:比较、掩码和布尔逻辑比较在许多情况下,数据集可能不完整或因无效数据的存在而受到污染。我们要基于某些准则来抽取、修改、计数或对一个数组中的值进行其他操作时,就需要掩码了。接下来将学习如何用 布尔掩码 来查看和操作数组中的值。和算术运算符一样,比较运算符在numpy中也是通过通用函数来实现的。比较运算符和其对应的通用函数如下:比较运算符通用函数==np.equal!=np.not_equal<np.less<=np.less.原创 2020-12-14 00:27:00 · 896 阅读 · 0 评论 -
NumPy数组的高级操作(一)
@R星校长stackstack的意思是堆叠的意思,所谓的堆叠就是将两个ndarray对象堆叠在一起组合成一个新的ndarray对象。根据堆叠的方向不同分为hstack以及vstack两种。hstack假如你是某公司的HR,需要记录公司员工的一些基本信息。可能你现在已经记录了如下信息:工号姓名出生年月联系电话1张三1988.12133233323332李四1987.2159666666663王五1990.1137777777774周六.原创 2020-12-12 21:52:34 · 1620 阅读 · 0 评论 -
NumPy基础及取值操作(四)
@R星校长第4关:随机数生成简单随机数生成NumPy的random模块下提供了许多生成随机数的函数,如果对于随机数的概率分布没有什么要求,则通常可以使用random_sample、choice、randint等函数来实现生成随机数的功能。random_samplerandom_sample用于生成区间为[0, 1]的随机数,需要填写的参数size表示生成的随机数的形状,比如size=[2, 3]那么则会生成一个2行3列的ndarray,并用随机值填充。示例代码如下:import numpy a.原创 2020-12-11 00:23:39 · 1838 阅读 · 0 评论 -
NumPy基础及取值操作(三)
@R星校长第3关:基础操作算术运算如果想要对ndarray对象中的元素做elementwise(逐个元素地)的算术运算非常简单,加减乘除即可。代码如下:import numpy as npa = np.array([0, 1, 2, 3])# a中的所有元素都加2,结果为[2, 3, 4, 5]b = a + 2# a中的所有元素都减2,结果为[-2, -1, 0, 1]c = a - 2# a中的所有元素都乘以2,结果为[0, 2, 4, 6]d = a * 2# a中.原创 2020-12-10 00:35:41 · 1965 阅读 · 0 评论 -
NumPy基础及取值操作(二)
@R星校长第2关:形状操作怎样改变ndarray对象的形状改变形状上一关介绍了怎样实例化ndarray对象,比如想实例化一个3行4列的二维数组,并且数组中的值全为0。就可能会写如下代码:import numpy as npa = np.zeros((3, 4))那如果想把a变成4行3列的二维数组,怎么办呢?比较聪明的同学可能会想到这样的代码:import numpy as npa = np.zeros((3, 4))# 直接修改shape属性a.shape = [4, 3]最后.原创 2020-12-08 23:07:28 · 2288 阅读 · 0 评论 -
2020-12-08 今天我宣布,我的博客要开始转型,专注于人工智能的数据分支,选择数据工程师到大数据工程师的进阶路线
@R星校长今日决定受到吴军一篇文章影响,《硅谷来信第三季》第037封信 | 凭一己之力能做到多少事?李希霍芬的大部分旅行发生在他23岁大学毕业时到38岁这之间的15年,这中间他很少有机会回到德国的家。这一段时间应该讲是人生最美好、最年富力强的时间,李希霍芬用这15年做了最有意义的事情。如果你是一个大学生,或者你的孩子在读大学,你可以了解一下李希霍芬的故事。人未必需要在刚从学校毕业的时候,就把自己的目标定在尽快有房有车上,应该考虑去做一些对自己和世界都更有意义的事情,否则人生的格局就太小了。人要是真.原创 2020-12-08 22:01:42 · 158 阅读 · 0 评论 -
NumPy基础及取值操作(一)
@R星校长怎样安装NumPy本地想要安装NumPy其实非常简单,进入命令行,输入pip install numpy即可。什么是ndarray对象NumPy为什么能够受到各个数据科学从业人员的青睐与追捧,其实很大程度上是因为NumPy在向量计算方面做了很多优化,接口也非常友好(总之就是用起来很爽)。而这些其实都是在围绕着NumPy的一个核心数据结构ndarray。ndarray的全称是N-Dimension Arrary,字面意义上其实已经表明了一个ndarray对象就是一个N维数组。但要注意的是.原创 2020-12-08 00:14:50 · 4685 阅读 · 0 评论 -
网页抓取及信息提取(三)
@R星校长第3关:网页数据分析任务描述下图是2016年国防科技大学分数线的网页,在浏览器中我们可以看到,各省的最高分、最低分、平均分都整齐地排列自在表格中。一个网页的源代码时常有成百上千行,其中很多代码都是为了布局页面样式服务的,而我们时常关心的是网页上的数据,而并不关心样式代码。所以如何从冗长的网页源代码中提取我们关心的数据,是这一关我们将要一起学习和体验的内容。相关知识课程视频 1《网页数据 - 使用正则表达式提取数据》上面的课程视频1介绍了如何使用正则表达式提取网页数据,下面通过文.原创 2020-11-27 00:13:09 · 6812 阅读 · 1 评论 -
网页抓取及信息提取(二)
@R星校长第2关:提取子链接上一关我们学习了如何访问给定的网页并保存信息到本地,本关我们要从上一关访问的网页中提取出嵌套的url地址,即实现子链接的提取。相关知识课程视频《网页数据 - 获取url子链接》下面通过文字进一步详细描述本关子链接提取的实现方法。网页信息中的子链接一个网站常常是一个主页中包含许多子链接,例如:点击上图国防科技大学本科招生信息网的第一行“国防科技大学2016年录取分数统计”,就能跳转到其子网页:子网页的网址为:http://www.gotonudt.cn/s.原创 2020-11-25 20:28:05 · 6513 阅读 · 2 评论 -
Python自动化办公,深度优先搜索文件夹并移动全部doc文件(深度优先算法)以及(文件、文件夹的移动、复制、删除、重命名)
Python自动化办公,深度优先搜索文件夹并移动全部doc文件(深度优先算法)以及(文件、文件夹的移动、复制、删除、重命名)原创 2020-11-20 23:43:24 · 415 阅读 · 0 评论 -
数据项目总结 -- 深圳租房数据分析
@R星校长第3关:Python数据库编程之插入数据最近在一个相对比较知名的房源网站上爬取了一份深圳各个区的租房信息,总共获得了2000*12的数据集。在获得了相应的数据之后,利用Python的第三方库pandas进行前期的数据清洗工作,最后可视化库plotly绘制了相应的可视化图形进行了展示,并且得到了一些租房的结论,供租房者参考,自己对深圳的租房也有了一定的认识。爬虫数据获取数据清洗处理数据可视化展示得到结论一、数据爬取本文中获得的数据是自己通过爬虫从网上获取的。这个房源没有太多.原创 2020-11-08 23:41:58 · 944 阅读 · 0 评论