- 博客(6)
- 收藏
- 关注
原创 大数据生态和Spark简介
一、大数据时代1.第三次信息化浪潮:根据IBM前首席执行官郭士纳的观点,IT领域每隔十五年就会迎来一次重大变革。2.数据产生方式的变革促成大数据时代的来临:①存储设备容量不断增加②CPU处理能力大幅提升③网络带宽不断增加等等,为大数据时代提供技术支撑。二、大数据概念1.大数据概念:大数据不仅仅是数据的“大量化”,而是包含“快速化”、“多样化”和“价值化”等多重属性。2.大数据的特点①数据量大:根据IDC作出的估测,数据一直都在以每年50%的速度增长,也就是说每两年就增长一倍(大数据摩
2021-02-28 11:47:52 948
原创 小小程序员的第五篇笔记
Python数据类型(2)列表(list)1、定义列表是Python 中使用最频繁的数据类型,在其他语言中通常叫做数组,通过索引进行查找,使用方括号”[]”。列表是有序的集合。2、应用场景定义列表使用[ ] 定义,数据之间使用“,”分割。3、列表支持索引和下标索引就是数据在列表中的位置编号,索引又可以被称为下标。列表的索引从0 开始,从列表中取值时,如果超出索引范围,程序会产生异常(IndexError: list index out of range)。4、列表的常用操作name_l
2020-12-06 13:22:44 138
原创 小小程序员的第四篇笔记
Python数据类型数字(numbers)Python中常用的是int(有符号整型)。字符串(str)1、定义字符串是Python 中最常用的数据类型。双引号或者单引号中的数据,就是字符串。2、下标和切片下标:所谓“下标”就是编号,就好比超市中的存储柜的编号,通过这个编号就能找到相应的存储空间。字符串实际上就是字符的数组,所以也支持下标索引。切片:切片是指对操作的对象截取其中一部分的操作。字符串、列表、元组都支持切片操作。切片的语法:[起始:结束:步长]。注意:选取的区间从"起始
2020-12-06 13:16:40 138
原创 小小程序员的第三篇笔记
第九章 模块1.什么是模块?python中的模块是一个包含事先定义好的函数和变量的文件,其后缀名是.py。模块可以被别的程序引入,以使用该模块中的函数等功能。**使用模块:**语法如下import 模块名例如import os一个模块只会被导入一次,不管你执行了多少次import。这样可以防止导入模块被一遍又一遍地执行。from 模块名 import 函数名(也可以是变量名或类名)from 模块名 import 函数名 as 别名 from 模块名 import *#把一个模块的所有
2020-11-21 15:58:15 172
原创 小小程序员的第二篇笔记
小小程序员的第二篇笔记1.生成器函数使用yield返回返回值,函数并没有结束,还可以继续执行生成器一次返回一个(组)数据def func1(): yield "h" yield "e" yield "l" yield "l" yield "o" gen = func1() #生成器对象1)生成器对象循环生成器对象时,一次获取一个值for i in gen:
2020-11-10 20:09:15 164
原创 小小程序员的第一篇笔记
Python函数第一篇笔记一、函数的定义:所谓函数,就是把具有独立功能的代码块组织成为一个小模块,在需要的时候调用。1、输入输出函数print函数:输出指定的汉字print("hello python") 字符串相加连接:print("hello","你好")# 使用”,“进行连接print("he" + "llo")# 字符串相加,进行字符串的连接,且不产生空格print(10+30)# 没有使用引号括起来,默认为数值,若是使用引号括起来,就是字符串# 若是数值使用加号连接,默认是
2020-11-04 08:59:46 476 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人