- 博客(6)
- 收藏
- 关注
原创 2021-02-28
大数据不仅仅是数据的‘大量化’,而是包含‘快速化’、‘多样化’和‘价值化’等多重属性。由结构化和非结构化数据组成。两大核心技术:分布式存储、分布式处理Spark特点:运行速度快:使用DAG执行引擎已支持循环数据流与内存计算容易使用:支持使用Scala、Java、Python和R语言进行编程,可通过SPARK Shell通用性:提供了完整而强大的技术栈,包括SQL查询、流式计算、机器学习和图算法组件运行模式多样:可运行于独立的集群模式,可运行Hadoop,也可运行Amazon EC2等云环境中,并
2021-02-28 12:00:11 52
原创 第五篇
1.引入库1.pickle.dumps(object):接收一个对象为参数,并返回对象的参数表达形式。2.pickle.dump(object,f):用来将对象opject写入二进制文件f中,第一个参数object是对象名,第二个参数f是文件对象。写入的数据同pickle.dumps(object)返回的字符串二、什是序列序列是被排成一列的数据,也就是说是有序的数据集合Python中有三种常用的序列:1.列表 list [1,2,3,4]2.元组 tuple (1,2,3,4)3.字符串 string
2020-11-28 20:15:48 80
原创 2020-11-22
、模块的引入同其他语言一样,我们使用import关键字来引入模块。语法格式为: import 模块名需要引入多个模块时,也可以这样写:import 模块名1,模块名2…注意:import 语句必须出现在文件最开始的地方三、引入模块时做了哪些事情?1、执行模块.py文件2、引入函数名、变量名(一般情况下,在模块中一般只定义函数而不执行函数,当然也会可以定义变量四、调用模块中的属性和方法语法格式为:模块名.函数名为什么要采用这种方式呢?假设这样一种情况,我们同时引入两个不同的模块A,B(包的
2020-11-22 16:48:17 425
原创 2020-11-13
1.生成器函数使用yield返回返回值,函数并没有结束,还可以继续执行生成器一次返回一个(组)数据def tools(func):def inter(*args,**kwargs):print(“开始执行…”)res = func(*args,**kwargs)print(“结束执行…”)return resreturn inter#生成器对象12345678123456781)生成器对象循环生成器对象时,一次获取一个值for i in gen:print(i)将生成器对象强制类型转换为列表print(l
2020-11-13 11:44:48 60
原创 2020-11-04
函数:是一个被封装起来的具有特定功能的代码段,可以被重复调用执行参数:形参:函数的局部变量,用于接收函数外部的数据实参:调用执行函数时,给它传递的外部的数据传参:将实参的值赋值给形参返回值:将函数内部的数据复制到函数外部return 返回值1,返回值2…参数的类型有1.位置参数:实参的赋值和形参定义的位置一致def func(x,y,z)print(“x:”,x,“y:”,y,“z:”,z)func(3, 9,12)2.命名参数:实参的顺序可以和形参不一致,执行函数时使用 (形参=实参
2020-11-04 09:06:44 119
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人