- 博客(6)
- 收藏
- 关注
原创 2021-03-04
大数据特征:1)大量化(Volume):存储量大,增量大 TB->PB2)多样化(Variety):来源多:搜索引擎,社交网络,通话记录,传感器格式多:(非)结构化数据,文本、日志、视频、图片、地理位置等3)快速化(Velocity):海量数据的处理需求不再局限在离线计算当中4)价值密度低(Value):但是这种价值需要在海量数据之上,通过数据分析与机器学习更快速的挖掘出来大数据带来的革命性变革:1)成本降低2)软件容错,硬件故障视为常态3)简化分布式并行计算Spark:Spa
2021-03-04 12:16:02 175 1
原创 2020-12-01
Python中datetime库常用的时间转换。#!/usr/bin/env pythoncoding: utf-8#(Python)时间转换import datetimetime_0=‘2020-12-1’#string转datetimetime_1=datetime.datetime.strptime(time_0,’%Y-%m-%d’)print(time_1)print(type(time_10)print(time_1.year)print(time_1.month)pri
2020-12-01 20:05:48 104
原创 2020-11-24
1.变量命名规则具有描述性,最好英文好一些不可以用特殊字符、空格和数字开头不能用中文保留字符勿用不能以大写字母开头(全大写留给逻辑 常量)驼峰命名法了解一下2.Python注释#注释一行‘’‘三个单引号之间注释多行“”"当内部有单引号占用的时候可以用三个双引号3.用户交互name = input(‘your name:’)age = input(‘your age:’)print(name, ‘is’, age, ‘years old’)4.强制类型转换a = 3s = s
2020-11-24 17:34:01 101
原创 Python笔记
python random模块(获取随机数)#随机一个小数,包含开始值和结束值import randomprint(random.randint(1,43))#指定范围内的随机浮点数import randomprint(random.uniform(10,20))#随机一个小数0~1之间的小数import randomprint(random.random())#随机范围(含头不含尾,不包含结束值)步长值import randomprint(random.randrange(0,11
2020-11-17 19:39:25 148
原创 Python-2
一、字符串的各种操作1,字符串的拼接s=‘hello’*2 用乘法重叠print(s) hellohellos=‘hello’+‘world’ 用加号拼接print(s) helloworlda=‘world’ 用join 拼接s=’’.join(a)print(s) world2,字符串的统计s=‘asjbsbjjdj’len(s) len() 统计字符串个数(也可以统计元组、列表、集合等) 10print(s[0]) s[n] 提取字符串中单个字母或元素,n是第
2020-11-10 18:41:13 285 1
原创 2020-11-03
1、Python中的数据类型分为如下几类:Number(数字):包括int,long,float,complexString(字符串): 例如:hello,“hello”,helloList(列表): 例如:[1,2,3],[1,2,3,[1,2,3],4]Dictionary(字典):例如:{1:“nihao”,2:“hello”}Tuple(元组): 例如:(1,2,3,abc)Bool(布尔):包括True、False2、简单介绍这几种数据类型数字类型:我们所说的类型是变量所指的内存
2020-11-03 13:45:01 731
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人