- 博客(6)
- 收藏
- 关注
原创 1
Spark是什么? Spark是个通用的集群计算框架,通过将大量数据集计算任务分配到多台计算机上,提供高效内存计算。 Spark拥有多种语言的函数式编程API,提供了除map和reduce之外更多的运算符,这些操作是通过一个称作弹性分布式数据集(resilient distributed datasets, RDDs)的分布式数据框架进行的。RDD 是指能横跨集群所有节点进行并行计算的分区元素集合。 RDD本质上是种编程抽象,代表可以跨机器进行分割的只读对象集合。RDD可以从一个继承结构(lineage)重
2021-02-28 19:13:45 72
原创 Python笔记5
序列 1、根据列表、元组、字符串的共同点把它们统称为序列 1)都可以通过索引来的到每一个元素 2)默认索引值都是从零开始(Python也支持负数索引) 3)都可以通过分片(切片)的方式得到新的字符串 4)都有相同的操作符(重复操作符、拼接操作符、成员关系操作符) 2、与之相关的内置函数 迭代的概念: 迭代是重复反馈过程的活动,其目的通常是为了逼近所需目标或结果。每一次对过程的重复称为一次“迭代”,而每一次迭代得到的结果会作为下一次迭代的初始值。 对计算机特定程序中需要反复执行的子程序*(一组指令),进行
2020-11-28 20:42:33 94
原创 Python笔记4
python中的随机函数(random) 1、python中的random函数 random() 方法返回随机生成的一个实数,它在[0,1)范围内 语法: import random random.random() randint函数,返回指定范围的一个随机整数,包含上下限 import random random.randint(0,99)#返回0~99之间的整数 randrange函数,randrange(0,101,2)可以用来选曲0~100之间的偶数 2、random.seed(int)
2020-11-22 20:42:15 87
原创 Python笔记3
1.什么是模块? 定义:逻辑上来说模块就是一组功能的组合;实质上一个模块就是一个包含了python定义和声明的文件,文件名就是模块名字加上.py的缀。 import加载的模块分为四个通用类别: a.使用python编写的代码(.py文件); b.已被编译为共享库或DLL的C或C++展; c.包好一组模块的包 d.使用C编写并链接到python解释器的内置模块; 2.如何使用模块? 想要使用模块,必须先要将模块加载进来,可以通过关键字 import 或 fr
2020-11-15 15:38:25 163
原创 Python笔记2
高阶函数 map() 函数 根据提供的函数对指定序列做映射。序列中的每一个元素调用 function 函数,可以是一个或多个序列,函数返回一个迭代器。 reduce() 函数 对参数序列中的元素进行累积。序列前两个元素调用 function 函数运算,得到的结果再与第三个元素进行运算,以此类推。函数返回值与初始参数 initializer 类型相同。 zip() 函数 将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。函数返回一个迭代器。如果各个迭代器的元
2020-11-09 10:58:35 235
原创 Python笔记
创建字典{‘name’: ‘yjx’, ‘age’: 22, ‘school’: ‘HIT’}的方法 直接创建 D={‘name’: ‘yjx’, ‘age’: 22, ‘school’: ‘HIT’} 逐步添加 D={} D[‘name’]=‘yjx’;D[‘age’]=22;D[‘school’]=‘HIT’ 键值对,用的比较多,但是key只能算是字符串D=dict(name=‘yjx’,age=22,school=‘HIT’) 其他dict方法 只要是元组构成的列表就可以,zip返回对象就是如此 D=
2020-11-02 18:05:10 133 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人