大数据
文章平均质量分 96
南石.
少年当有凌云志,万里长空竞风流;
展开
-
“Numpy数据分析与挖掘:高效学习重点技能“
在计算统计中,如果把nan的值替换为0进行统计,这样并不合适,替换之前的平均值如果大于0,替换之后均值肯定会变小;统计存在有nan的列,将nan的列中其它不等于nan的值进行mean求出均值,:小于15000的赋值为15000,大于等于50000的赋值为50000。:小于15000的赋值为0,大于等于15000的赋值为10。将统计除nan列的均值,再将均值赋值给当前列的nan值上;在数组运算中,不同的列,但是相同的行,是可以进行运算的;1.均匀分布:在相同的大小范围内的出现概率是等可能的;原创 2024-07-10 00:07:36 · 993 阅读 · 0 评论 -
Python第二语言(十四、高阶基础)
设计模式是一种编程套路,可以极大的方便程序的开发;最常见、最经典的设计模式,是面向对象设计模式;除了面向对象外,在编程中也有很多既定的套路可以方便开发,我们称之为设计模式:单例、工厂模式、建造者、责任链、状态、备忘录、解释器、访问者、观察者、中介、模板、代理模式等...原创 2024-06-13 23:24:37 · 869 阅读 · 0 评论 -
Python第二语言(十三、PySpark实战)
Apache Spark是用于大规模数据(large-scala data)处理的统一(unifield)分析引擎;Spark是一款分布式的计算框架,用于调度成百上千的服务器集群,计算TB、PB乃至EB级别的海量数据;Python On Spark:Python语言,是Spark重点支持的方向;PySpark是由Spark官方开发的Python语言第三方库;Python开发者可以使用pip程序快速安装PySpark并像其它第三方库一样使用;主要作用:进行数据处理;原创 2024-06-13 22:45:51 · 1298 阅读 · 0 评论 -
Python第二语言(十二、SQL入门和实战)
demo`id` int(11) NOT NULL COMMENT '主键',`date_time` datetime DEFAULT NULL COMMENT '日期',`order_id` varchar(40) DEFAULT NULL COMMENT '订单id',`money` int(4) DEFAULT NULL COMMENT '销售额',`province` varchar(40) DEFAULT NULL COMMENT '销售省份',原创 2024-06-13 22:08:06 · 581 阅读 · 0 评论 -
Python第二语言(十一、Python面向对象(下))
面向对象编程,是许多编程语言都支持的一种编程思想;基本思想:基于模板(类)去创建实体(对象),使用对象完成功能开发;原创 2024-06-13 21:51:41 · 744 阅读 · 0 评论 -
Python第二语言(十、Python面向对象(上))
我们可以使用类去封装属性,并基于类创建出一个个的对象来使用;而类的成员一般都会有:成员变量,成员方法对象 = 类名称()class 类名称: # class是关键字,表示定义一个类类的属性 # 即定义在类中的变量(成员变量)类的行为 # 即定义在类中的函数(成员方法)在类中定义成员方法和定义函数基本一致:def 方法名(se1f,形参1,.....·,形参N):方法体self关键字:self关键字是成员方法定义的时候,必须填写的;它用来表示类对象自身的意思;原创 2024-06-12 22:58:22 · 762 阅读 · 0 评论 -
Python第二语言(九、Python第一阶段实操)
本章内容:使用之前学习到的Python基础知识通过echarts大屏组件来进行可视化开发;原创 2024-06-09 21:03:02 · 902 阅读 · 1 评论 -
Python第二语言(八、Python包)
包下有__init__.py就是包,无__init__.py就是文件夹。于Java一样,当我们的模块文件越来越多时,包可以帮助我们管理这些模块,包的作用就是包含多个模块,但包的本质依然是模块;包可以包含一堆的Python模块,而每个模块又内含许多的功能;一个包,就是一堆同类型功能的集合体;在Python程序的生态中,有许多非常多的第三方包(非Python官方),可以极大的帮助我们提高开发效率:科学计算中常用的:numpy包;数据分析中常用的:pandas包;原创 2024-06-09 20:40:57 · 940 阅读 · 1 评论 -
Python第二语言(七、Python模块)
Python 模块(Module),是一个 Python 文件,以.py结尾;模块的作用:python中有很多各种不同的模块,每一个模块都可以帮助我们快速的实现一些功能,比如实现和时间相关的功能就可以使用time模块我们可以认为一个模块就是一个工具包,每一个工具包中都有各种不同的工具供我们使用进而实现各种不同的功能;Python中ifname== ‘main‘:的作用和原理_python if-CSDN博客这个if的作用是:__name__这是python自带的不用管,'main。原创 2024-06-09 20:33:09 · 1241 阅读 · 0 评论 -
Python第二语言(六、Python异常)
(调用函数的时候,如果出现了异常,可以在最终调用的函数中处理异常)注意:当所有函数都没有捕获异常的适合,程序会报错;(后面不加异常类型就代表捕获全部异常)原创 2024-06-09 20:18:35 · 350 阅读 · 0 评论 -
Python第二语言(五、Python文件相关操作)
内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U盘等设备。为了便于数据的管理和检索,引入了“文件”的概念。一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别。原创 2024-06-09 20:11:45 · 755 阅读 · 1 评论 -
Python第二语言(四、Python数据容器)
定义元组使用小括号,且使用逗号隔开各个数据,数据可以是不同的数据;# 定义3个元素的元组# 定义1个元素的元组t2 = ('hello',) # 注意:必须带有逗号,否则不是元组类型print(t1)print(t2)# 定义集合字面量{'元素', '元素', ..., '元素'}# 定义集合变量变量名称 = {'元素', '元素', ..., '元素'}# 定义空集合变量名称 = set()字典的key和value可以是任意数据类型(但是key不可为字典)不允许key的重复。原创 2024-06-06 22:17:14 · 1044 阅读 · 0 评论 -
Python第二语言(三、Python函数def)
使用方式:列表.sort(key=选择排序依据的函数,reverse=TruelFalse)参数key,是要求传入一个函数,表示将列表的每一个元素都传入函数中,返回排序的依据;参数reverse,是否反转排序结果,True表示降序,False表示升序;列表的sort方法:# 按照choose_sort_key的值reverse=True降序来排序,False为升序lambda简写形式:# 简写# 按照choose_sort_key的值reverse=True降序来排序,False为升序。原创 2024-06-06 00:03:09 · 831 阅读 · 0 评论 -
Python第二语言(二、Python语言基础)
单引号定义法:name = '张三'双引号定义法:name = "张三"三引号定义法:name = """张三"""三引号定义法,和多行注释的写法一样,同样支持换行操作;使用变量接收它,它就是字符串;不使用变量接收它,就可以作为多行注释使用;原创 2024-06-05 00:04:25 · 881 阅读 · 1 评论 -
Python第二语言(一、Python start)
1. idea中python项目no python interpreter configured for the module(需要python解释器)一般学习Python都用Pycharm软件,这里有需要的人可以去别的文章看看怎么下载,在我的python记录中,基本使用的是IDEA开发工具;1. 我们可以将代码,写入一个以".py"结尾的文件中,使用python命令去运行它;在CMD(命令提示符)程序中输入python并回车,然在输入代码回车即可立即执行;遇到的问题(无python解释器)原创 2024-06-04 23:42:36 · 662 阅读 · 0 评论