![](https://img-blog.csdnimg.cn/64d12d31425249239c93262ebd7803d2.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
bigdatav027——python
BigDataPython
yanqi_vip
strove with none, for none was worth my strife.Nature I loved and, next to Nature, Art:I warm'd both hands before the fire of life.It sinks, and I am ready to depart ——W.S.Landor
展开
-
CC00001.python——|Hadoop&Python.v01|——|Arithmetic.v01|基础|概述|
一、Python入门:Python语言介绍:为什么使用Python进行数据分析### --- Python入门:Python语言介绍:为什么使用Python进行数据分析~~~ 数据分析本身是一份非常古老的工作,随着互联网、大数据的发展,~~~ 现在人类每一年创造的数据量是之前人类历史的总和!~~~ 传统的数据分析方法难以应对如此规模和丰富多变的数据。...原创 2022-04-16 14:22:00 · 70 阅读 · 0 评论 -
CC00002.python——|Hadoop&Python.v02|——|Arithmetic.v02|基础|安装|
一、Python安装及配置### --- Python版本介绍~~~ Python目前有两个版本共存,Python 2 和 Python 3,~~~ 其中Python官方宣布:Python 2于2020年1月1日起不再维护,~~~ 所以如果你现在开始学Python,肯定是要学习Python3了。~~~ 但由于Python2的生命周期较长,...原创 2022-04-16 14:22:00 · 135 阅读 · 0 评论 -
CC00003.python——|Hadoop&Python.v03|——|Arithmetic.v03|基础|Python310安装.V1|
一、Python310安装配置1、下载地址:https://www.python.org/ftp/python/3.10.1/python-3.10.1-amd64.exe2、自定义安装3、自定义插件安装4、更改安装目录5、安装成功二、配置环境变量:1、配置系统环境变量:配置Python310_home环境变量2、配置Path变量...原创 2022-04-16 14:23:00 · 346 阅读 · 0 评论 -
CC00004.python——|Hadoop&Python.v04|——|Arithmetic.v04|基础:PyCharm.20200205安装.V2|
一、PyCharm.20200205安装1、下载地址:https://www.jetbrains.com/pycharm/download/download-thanks.html?platform=windows&code=PCC2、安装PyCharm.202002053、更改安装目录4、安装设置5、选择开始启动方式6、安装完成,是...原创 2022-04-16 14:23:00 · 71 阅读 · 0 评论 -
CC00005.python——|Hadoop&Python.v05|——|Arithmetic.v05|语法:交互式编程|
一、交互式编程### --- 交互式编程~~~ 在上面的步骤中,我们输入了一行代码,按回车键后,~~~ 将代码提交给了Python内置的解释器,解释器运行了代码后,将运行结果打印在了控制台上, ~~~ 这种一次输入对应一次输出的形式,我们称之为交互式编程。~~~ 试试将Hello world 案例中右边的引号去掉,看看会输出什么。~~~...原创 2022-04-16 14:24:00 · 92 阅读 · 0 评论 -
CC00006.python——|Hadoop&Python.v06|——|Arithmetic.v06|语法:核心语法&变量.V1|
一、核心语法:变量### --- 变量的定义~~~ 变量就是可变的量,对于一些有可能会经常变化的数据,我们需要使用一个符号,~~~ 这样才能计算中使用它,就像我们在小学时学过的一元方程中的"x"一样。~~~ 比如说,我们在控制台内输入:~~~ 这样我们就新定义了一个变量,它的值是"world", ~~~ 我们稍稍修改一下Hel...原创 2022-04-16 14:24:00 · 64 阅读 · 0 评论 -
CC00007.python——|Hadoop&Python.v07|——|Arithmetic.v07|语法:核心语法&数据类型.V1|
一、数据类型### --- 数据类型~~~ 如果有学习过其他编程语言的同学,~~~ 可能在学习变量的时候就会想问,在Python中定义一个变量的时候,怎么没有先声明它的类型呢?~~~ 这正是Python的简洁高效之处。变量在Python中是不区分类型的,~~~ 但它的值有类型,不同的值有不同的类型,我们来了解一下下面这三种基本的数据类型:...原创 2022-04-16 14:24:00 · 72 阅读 · 0 评论 -
CC00008.python——|Hadoop&Python.v08|——|Arithmetic.v08|语法:核心语法&数据类型转换.V2|
一、数据类型转换### --- 布尔值转换~~~ 要想把其他值转换为布尔值,需要使用一个内置函数bool(),~~~ 我们在控制台按顺序输入以下的代码:关于函数的概念我们在后面的课程中会学习,~~~ Python的内置函数有很多,我们也会一一学习。~~~ # 以下值都为Truebool(1)bool(-1)bool(255)...原创 2022-04-16 14:25:00 · 282 阅读 · 0 评论 -
CC00009.python——|Hadoop&Python.v09|——|Arithmetic.v09|语法:核心语法&运算符.V1|
一、运算符:算数运算符:算术运算符:Python中进行数值运算需要的符号如下,我们来一一学习一下。运算符描述实例+加1 + 1; a + b-减10 - 5; a - b -c*乘4 * 2 相当 4 × 2/除4 / 2 相当于 4 ÷ 2//取整除10 // 4 结果是%取模10 % 4 相当于 10 ...原创 2022-04-16 14:25:00 · 73 阅读 · 0 评论 -
CC00010.python——|Hadoop&Python.v10|——|Arithmetic.v10|语法:核心语法&运算符.V2|
一、使用算术运算符操作字符串### --- 对,没有看错,字符串在Python中也可以“运算”,有两种操作,我们先看看加法。print("Hello " + "world")### --- 加号可以将两个字符串拼接成一个字符串,也可以将多个字符串拼接在一起:print("apple " + "apple " + "apple ")### --- 那如果有太多的"ap...原创 2022-04-16 14:26:00 · 75 阅读 · 0 评论 -
CC00011.python——|Hadoop&Python.v11|——|Arithmetic.v11|语法:核心语法&流程控制.V1|——|条件判断|
一、流程控制### --- 流程控制~~~ 经过前面三个小节的学习,我们已经对Python编程语言有了一个初步的了解。~~~ 如果说Python是一条蟒蛇,变量、数据类型、运算符就是它的肌肉和骨架,~~~ 而流程控制相当于它的神经系统,掌握了流程控制知识,就可以让Python灵活的游动起来。~~~ Python的流程控制比较简洁,主要分为...原创 2022-04-16 14:26:00 · 58 阅读 · 0 评论 -
CC00012.python——|Hadoop&Python.v12|——|Arithmetic.v12|语法:核心语法&流程控制.V2|——|循环|
一、循环### --- 循环~~~ 看到循环我们首先会想到一些物体,比如旋转的风扇、车轮,一个圆的形状。~~~ 一个圆形的跑道,如果沿着它跑,除非我们自己停下来,永远不会有终点,~~~ 但是可以计算我们跑了多少圈。~~~ 假设我们在跑步之前,给自己设定一个目标,跑完10圈就不跑了,~~~ 然后去一圈一圈的跑完了10圈,停止。这个过程...原创 2022-04-16 14:27:00 · 67 阅读 · 0 评论 -
CC00013.python——|Hadoop&Python.v13|——|Arithmetic.v13|语法:核心语法&流程控制.V3|——|智能密码锁|
一、编程实现:智能密码锁程序### --- 编程实现:智能密码锁程序~~~ 最近几年很流行的智能密码锁程序,除了可以用指纹开锁、人脸识别开锁外,~~~ 都会有密码开锁的功能,以防万一。~~~ 密码开锁功能是这样的,首先设定好密码,~~~ 以后每次开锁的时候只要输入的数字中含有设定的密码,就视为解锁成功。~~~ 这样的设定是为了防止别...原创 2022-04-16 14:27:00 · 74 阅读 · 0 评论 -
CC00014.python——|Hadoop&Python.v14|——|Arithmetic.v14|语法:数据结构&字符串.V1|
一、数据结构:字符串### --- 数据结构:字符串~~~ 在任何一门编程语言中,字符串都是最基础、最重要的数据结构。~~~ 前面我们已经学习过字符串的基本使用方法,现在继续深入的学习更多的知识。一、字符串的格式化输出:### --- 格式化运算符~~~ # 在之前while循环的一个例子中, 有这样一行代码:print("我跑完了...原创 2022-04-16 14:28:00 · 180 阅读 · 0 评论 -
CC00015.python——|Hadoop&Python.v15|——|Arithmetic.v15|语法:数据结构&元组tuple.V2|
一、元组 tuple:定义元组~~~ # 现在我们知道了字符串是一种序列,它可以迭代循环,也可以按索引访问,也可以切片访问。但它的组成只能是单个的字符,现在来介绍一种更多元化的序列:元组,英文叫tuple,可这样来定义一个元组:t = ('My', 'age', 'is', 18)~~~ # 在这个元组中包含了3个字符串,一个整形数字,元组中的每一项称作元素,4...原创 2022-04-16 14:28:00 · 179 阅读 · 0 评论 -
CC00016.python——|Hadoop&Python.v16|——|Arithmetic.v16|语法:数据结构&列表list.V3|
一、列表 list### --- 定义列表~~~ # 列表可以理解为可变的元组,它的使用方式跟元组差不多,区别就是列表可以动态的增加、修改、删除元素。~~~ # 以上方式都可以定义一个列表。注意变量名使用了lst,有意的避开了list,虽然list不是关键字,但我们在命名变量的时候不要使用这些内置名称,否则可能会引起无法预知的错误。~~~ # 定义一个...原创 2022-04-16 14:29:00 · 61 阅读 · 0 评论 -
CC00017.python——|Hadoop&Python.v17|——|Arithmetic.v17|语法:数据结构&字典dict.V4|
一、字典 dict### --- 类似这种销售信息的数据结构,我们使用元组或者列表存储是可以的。top_sales = [('Peter', 213), ('John', 253), ('Tony', 284), ('Henry', 205), ('Mike', 280)]### --- 可以很方便的取出在这个榜单中第一名、第二名或者任意一名的销售数据。但它有一个缺点,如果我们...原创 2022-04-16 14:29:00 · 60 阅读 · 0 评论 -
CC00018.python——|Hadoop&Python.v18|——|Arithmetic.v18|语法:数据结构&集合set.V5|
一、集合 set:集合在Python中是一个无序的不重复的序列,一般用来删除重复数据还可以计算交集并集等。### --- 集合的定义~~~ # 这两方式都可以定义一个集合nums = {1, 2, 3, 4, 5}nums = set([1, 2, 3, 4, 5])~~~ # 注意,集合是无序的,虽然我们在书写的时候是按照从小到大的顺序,有时候遍历出来...原创 2022-04-16 14:30:00 · 76 阅读 · 0 评论 -
CC00019.python——|Hadoop&Python.v19|——|Arithmetic.v19|语法:进阶&函数.V1|
一、Python进阶:函数### --- Python进阶:函数~~~ 在前面的学习过程中,我们已经接触了很多次函数,~~~ 现在我们来好好的认识一下这个重要的小伙伴。~~~ 函数就是一段可以重复调用的代码在Python中函数是非常重要的概念,在编程中几乎无处不在。一、函数定义及调用### --- 在Python在, 我们使用d...原创 2022-04-16 14:30:00 · 221 阅读 · 0 评论 -
CC00020.python——|Hadoop&Python.v20|——|Arithmetic.v20|语法:进阶&面向对象.V2|
一、面向对象### --- 面向对象基本概念~~~ # 面向过程:~~~ 根据业务逻辑从上到下写代码。~~~ # 面向对象:~~~ 将变量与函数、属性绑定到一起,分类进行封装,每个程序只要负责分配给自己的功能,~~~ 这样能够更快速的开发程序,减少了重复代码。~~~ 我们在前面写的代码都是面向过程的,这对初学者比较容易接受...原创 2022-04-16 14:31:00 · 76 阅读 · 0 评论 -
CC00021.python——|Hadoop&Python.v21|——|Arithmetic.v21|语法:进阶&模块和包管理.V3|
一、模块和包管理### --- 模块和包管理~~~ Python中具有丰富的标准库和第三方库,学习并掌握模块、包的概念尤为重要,~~~ 决定了我们是否能够利用这些丰富的资源,以及如何妥善组织好我们自己的代码。一、模块的导入~~~ # 首先,我们来导入一个内置模块import math~~~ # math是Python标准...原创 2022-04-16 14:31:00 · 98 阅读 · 0 评论 -
CC00024.python——|Hadoop&Python.v02|——|Arithmetic.v02|Jupyter交互程序:Jupyter插件配置|
一、指定默认启动目录### --- 查看jupyter_noteboot_config.py配置文件所在地址C:\Users\Administrator>jupyter notebook --generate-configOverwrite C:\Users\Administrator\.jupyter\jupyter_notebook_config.py### -...原创 2022-04-16 14:34:00 · 78 阅读 · 0 评论 -
CC00025.python——|Hadoop&Python.v03|——|Arithmetic.v03|NumPy科学计算库:NumPy模块安装|
一、NumPy科学计算库### --- 安装numpy模块C:\Users\Administrator>pip install numpy -i https://pypi.tuna.tsinghua.edu.cn/simple~~~输出参数:Successfully installed numpy-1.21.5二、启动jupyter终端###...原创 2022-04-16 14:34:00 · 101 阅读 · 0 评论 -
CC00026.python——|Hadoop&Python.v04|——|Arithmetic.v04|NumPy科学计算库:NumPy数组创建|
一、NumPy科学计算库### --- Po,功夫熊猫中阿宝。勤加练习,你就所向披靡!~~~ NumPy(Numerical Python)是Python的⼀种开源的数值计算扩展。~~~ 提供多维数组对象,各种派⽣对象(如掩码数组和矩阵),这种⼯具可⽤来存储和处理⼤型矩阵,~~~ ⽐Python⾃身的嵌套列表(nested list structu...原创 2022-04-16 14:35:00 · 76 阅读 · 0 评论 -
CC00027.python——|Hadoop&Python.v05|——|Arithmetic.v05|NumPy科学计算库:NumPy数据类型|
一、数据类型### --- ndarray的数据类型:int: int8、uint8、int16、int32、int64float: float16、float32、float64str### --- array创建时,指定import numpy as npnp.array([1,2,5,8,2],dtype = 'float32')# 输出 :array([...原创 2022-04-16 14:35:00 · 63 阅读 · 0 评论 -
CC00028.python——|Hadoop&Python.v06|——|Arithmetic.v06|NumPy科学计算库:NumPy数组运算|
一、数组运算### --- 加减乘除幂运算import numpy as nparr1 = np.array([1,2,3,4,5])arr2 = np.array([2,3,1,5,9])arr1 - arr2 # 减法arr1 * arr2 ...原创 2022-04-16 14:36:00 · 74 阅读 · 0 评论 -
CC00029.python——|Hadoop&Python.v07|——|Arithmetic.v07|NumPy科学计算库:NumPy复制视图|
一、复制和视图:在操作数组时,有时会将其数据复制到新数组中,有时不复制。有以下三种情况### --- 完全没有复制import numpy as npa = np.random.randint(0,100,size = (4,5))b = aa is b # 返回Tru...原创 2022-04-16 14:36:00 · 65 阅读 · 0 评论 -
CC00030.python——|Hadoop&Python.v08|——|Arithmetic.v08|NumPy科学计算库:NumPy索引/切⽚/迭代|
一、索引、切⽚和迭代:基本索引和切⽚### --- numpy中数组切⽚是原始数组的视图,这意味着数据不会被复制,视图上任何数据的修改都会反映到原数组上arr = np.array([0,1,2,3,4,5,6,7,8,9])arr[5] # 索引 输出 5arr[5:8...原创 2022-04-16 14:37:00 · 73 阅读 · 0 评论 -
CC00031.python——|Hadoop&Python.v09|——|Arithmetic.v09|NumPy科学计算库:NumPy形状操作|
一、形状操作### --- 数组变形import numpy as nparr1 = np.random.randint(0,10,size = (3,4,5))arr2 = arr1.reshape(12,5) # 形状改变,返回新数组arr3 = arr1.reshape(-1,5) ...原创 2022-04-16 14:37:00 · 286 阅读 · 0 评论 -
CC00032.python——|Hadoop&Python.v10|——|Arithmetic.v10|NumPy科学计算库:NumPy广播机制|
一、⼴播机制### --- ⼴播机制~~~ 当两个数组的形状并不相同的时候,我们可以通过扩展数组的⽅法来实现相加、相减、~~~ 相乘等操作,这种机制叫做⼴播(broadcasting)### --- ⼀维数组⼴播import numpy as nparr1 = np.sort(np.array([0,1,2,3]*3)).reshape(4...原创 2022-04-16 14:38:00 · 99 阅读 · 0 评论 -
CC00033.python——|Hadoop&Python.v11|——|Arithmetic.v11|NumPy科学计算库:NumPy通用函数|
一、通⽤函数:元素级数字函数### --- abs、sqrt、square、exp、log、sin、cos、tan,maxinmum、minimum、all、any、inner、clip、round、trace、ceil、floorimport numpy as nparr1 = np.array([1,4,8,9,16,25])np.sqrt(arr1) ...原创 2022-04-16 14:38:00 · 96 阅读 · 0 评论 -
CC00034.python——|Hadoop&Python.v12|——|Arithmetic.v12|NumPy科学计算库:NumPy线性代数|
一、线性代数:矩阵乘积### --- 矩阵的乘积A = np.array([[4,2,3], [1,3,1]]) # shape(2,3)B = np.array([[2,7], [-5,-7], [9,3]]) # shape(3,2)np.dot(A,B) ...原创 2022-04-16 14:39:00 · 181 阅读 · 0 评论 -
CC00035.python——|Hadoop&Python.v13|——|Arithmetic.v13|NumPy科学计算库:NumPy分析鸢尾花花萼属性|
一、实战-⽤NumPy分析鸢尾花花萼属性各项指标### --- 案列:读取iris数据集中的花萼⻓度数据(已保存为csv格式)~~~ 并对其进⾏排序、去重,并求出和、累积和、均值、标准差、⽅差、最⼩值、最⼤值。import numpy as np # 导⼊类库 numpydata = n...原创 2022-04-16 14:39:00 · 645 阅读 · 0 评论 -
CC00037.python——|Hadoop&Python.v01|——|Arithmetic.v01|Pandas数据分析库:Pandas模块安装|
一、Pandas模块安装### --- 在windows.dos下安装pandasC:\Users\Administrator>pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple~~~输出参数Installing collected packages: pytz, pandasSuccess...原创 2022-04-16 14:40:00 · 181 阅读 · 0 评论 -
CC00038.python——|Hadoop&Python.v02|——|Arithmetic.v02|Pandas数据分析库:Pandas数据结构|
一、pandas数据分析库### --- pandas数据分析库~~~ Python在数据处理和准备⽅⾯⼀直做得很好,但在数据分析和建模⽅⾯就差⼀些。~~~ pandas帮助填补了这⼀空⽩,使您能够在Python中执⾏整个数据分析⼯作流程,~~~ ⽽不必切换到更特定于领域的语⾔,如R。~~~ 与出⾊的 jupyter⼯具包和其他库相...原创 2022-04-16 14:41:00 · 227 阅读 · 0 评论 -
CC00039.python——|Hadoop&Python.v03|——|Arithmetic.v03|Pandas数据分析库:Pandas数据查看|
一、数据查看### --- 查看DataFrame的常⽤属性和DataFrame的概览和统计信息import numpy as npimport pandas as pd### --- 创建 shape(150,3)的⼆维标签数组结构DataFramedf = pd.DataFrame(data = np.random.randint(0,151,size = (150,3...原创 2022-04-16 14:41:00 · 68 阅读 · 0 评论 -
CC00040.python——|Hadoop&Python.v04|——|Arithmetic.v04|Pandas数据分析库:Pandas数据输入输出|
一、数据输⼊与输出:csv### --- csvimport numpy as npimport pandas as pddf = DataFrame(data = np.random.randint(0,50,size = [50,5]), # 薪资情况 columns=['IT','化⼯','⽣物','教师','⼠兵']...原创 2022-04-16 14:42:00 · 76 阅读 · 0 评论 -
CC00041.python——|Hadoop&Python.v05|——|Arithmetic.v05|Pandas数据分析库:Pandas数据选取|
一、数据选取:获取数据### --- 获取数据import pandas as pdimport numpy as npdf = pd.DataFrame(data = np.random.randint(0,150,size = [150,3]), # 计算机科⽬的考试成绩columns=['Python','Tensorflow','Keras'])df[...原创 2022-04-16 14:42:00 · 61 阅读 · 0 评论 -
CC00042.python——|Hadoop&Python.v06|——|Arithmetic.v06|Pandas数据分析库:Pandas数据集成|
一、数据集成:pandas 提供了多种将 Series、DataFrame 对象组合在⼀起的功能### --- concat数据串联~~~ # concat数据串联import pandas as pdimport numpy as npdf1 = pd.DataFrame(data = np.random.randint(0,150,size = [10,3]),...原创 2022-04-16 14:43:00 · 85 阅读 · 0 评论 -
CC00043.python——|Hadoop&Python.v07|——|Arithmetic.v07|Pandas数据分析库:Pandas数据清洗|
一、数据清洗### --- 数据清洗import numpy as npimport pandas as pddf = pd.DataFrame(data = {'color':['red','blue','red','green','blue',None,'red'], 'price':[10,20,10,15,20,0...原创 2022-04-16 14:43:00 · 177 阅读 · 0 评论