- 博客(6)
- 问答 (1)
- 收藏
- 关注
原创 2021-03-03
大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。大数据的五大特征:1、大量;2、高速;3、多样;4、低价值密度;5、真实性。由结构化和非结构化数据组成。两大核心技术分别是分布式存储、分布式处理Hadoop缺点:①表达能力有限,②磁盘IO开销大, 延迟高,③任务之间衔接设计IO开销在之前一个任务执行完成之前,其他任务 就无法开始难以胜任Hadoop两大核心:HDFS和MapReduceSpark使用Scala语言进行实现,它是一种面向对象、函数式编程语言,能够像操作本地集合
2021-03-03 14:41:13 81 1
原创 py5
字典字典(dict,全称: dictionary )是python内置的一种使用“键值对结构”存储数据的存储模型。在其它语言中也称为map或者是object(对象)特点一、字典不具备索引的概念,但可以通过字典的键key操作字典中存储的数据值value二、字典(dict)内部存放的顺序和键key放入的顺序是没有关系的。三、字典可以根据键(key)进行数据的添加、删除、修改、查询等操作四、字典通过键(key)计算位置的算法称为哈希算法(Hash)五、 要保证hash的正确性, 作为key的对象就不
2020-12-02 19:57:08 544
原创 Py④
模块:.py文件,所有的Python脚本都可以作为Python模块被调用。包:存放有相互关联的一组Python模板的文件夹。init.py文件。pyc:经过Python编译后的py模块文件,执行速度更快。import p1print(p1.a *p1.b)p1.hello()from包/模块/包.模块/import模块/函数/变量 as 别名。from p1 import a,bfrom p1 import hello as hprint(a,b,a+b)h()from tools.p1 import h
2020-11-23 19:35:03 67
原创 py③
一、OS模块os.getcwd()获取当前工作目录,即当前python脚本工作的目录路径os.chdir(“dirname”)改变当前脚本工作目录;相当于shell下cdos.curdir返回当前目录: (’.’)os.pardir获取当前目录的父目录字符串名:(’…’)os.makedirs(‘dirname1/dirname2’)可生成多层递归目录os.removedirs(‘dirname1’)若目录为空,则删除,并递归到上一级目录,如若也为空,则删除,依此类推os.mkdi
2020-11-23 07:26:01 95 1
原创 py②
模块:.py文件,所有的Python脚本都可以作为Python模块被调用。包:存放有相互关联的一组Python模板的文件夹。init.py文件。pyc:经过Python编译后的py模块文件,执行速度更快。import p1print(p1.a *p1.b)p1.hello()from包/模块/包.模块/import模块/函数/变量 as 别名。from p1 import a,bfrom p1 import hello as hprint(a,b,a+b)h()from tools.
2020-11-13 06:47:00 110
空空如也
pycharm生成词云
2021-03-17
TA创建的收藏夹 TA关注的收藏夹
TA关注的人