python
文章平均质量分 70
是一只萨摩耶
编程很枯燥,但是养只修勾一定很有趣
展开
-
Python的标准模块介绍:sys、os、random和time
上述代码首先导入了time模块,使用time()函数获取了当前的时间,然后使用pow()函数计算1000的10000次方,在计算该结果时会产生一定的计算时间,计算结束后再次使用time()函数获取当前的时间,最后计算两个时间的差值,以得到程序执行的时间。上述代码首先导入了random模块与time模块,然后定义了两个列表name_li1与name_li2, 遍历列表name_li1,调用choice()函数随机选择一个元素,并将随机获取的元素每隔2秒添加到列表name_li2中,直至全部添加。原创 2023-02-23 10:39:37 · 687 阅读 · 0 评论 -
使用Python可视化工具有哪些好处?
研究表明,80%的人能记得所看到的事物,而只有20%的人能记得所阅读的文字。因此,相较于文字类型的数据,人眼对图形的敏感度更高,记忆的时间更久。数据可视化能更好地寻找关系,可以很快的看到全部的数据变化以及局部的数据变化,而当这些变化以最简单的方式呈现出来之后,我们就可以看到全部和局部的关系,可视化让数据变得简洁,让数据关系呈现的更,直观更便于分析。在可视化的分析下,数据将每一维的值分类、排序、组合和显示,这样就可以看到表示对象或事件的数据的多个属性或变量。人脑对视觉信息的处理要比书面信息块10倍。原创 2023-01-05 16:56:51 · 554 阅读 · 0 评论 -
Hadoop数据仓库有哪些特征?
数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。数据仓库的目的是构建面向分析的集成化数据环境,分析结果为企业提供决策支持(Decision Support)。数据仓库本身并不“生产”任何数据,其数据来源于不同外部系统;同时数据仓库自身也不需要“消费”任何的数据,其结果开放给各个外部应用使用。Hadoop数据仓库的主要特征有面向主题性、集成性、非易失性和时变性,接下来对这四个特性做详细介绍。原创 2023-01-03 15:53:00 · 517 阅读 · 2 评论 -
Spark有几种部署方式?
Standalone模式被称为集群单机模式。Spark框架与Hadoop1.0版本框架类似,本身都自带了完整的资源调度管理服务,可以独立部署到一个集群中,无需依赖任何其他的资源管理系统,在该模式下,Spark集群架构为主从模式,即一台Master节点与多台Slave节点,Slave节点启动的进程名称为Worker,此时集群会存在单点故障问题,后续将在Spark HA集群部署小节讲解利用Zookeeper解决单点问题的方案。lYarn Cluster:用于生产环境,所有的资源调度和计算都在集群上运行。原创 2022-12-16 15:04:13 · 727 阅读 · 0 评论 -
Python中怎样选择正确的可视化图表?
若数据为单变量,可以选择直方图或正态分布图:若数据为2个变量,可以选择散点图:若数据为3个变量,可以选择曲面图。若是静态数据,可以选择饼图、瀑布图或堆积柱形图:若为镇时间变化的数据,则先按照周期数分为少数周期数据和多周期数据,对于少数周期数据可以选择堆积柱形图,对于多周期数据可以选择堆积面积图。由图1可知,若数据按照时间进行比较,当数据周期少时可以选择柱形图或折线图,当数据周期多时可以选择雷达图或折线图;对于用户而言,选择正确的图表是十分关键的,不仅可以达到“一图胜千言”的效果,而且会直接影响分析的结果。原创 2022-11-08 11:28:29 · 607 阅读 · 0 评论 -
Kafka消费者分区分配策略
这样可以明显减少系统资源的浪费,例如:之前consumer0、consumer1之前正在消费某几个分区,但由于rebalance发生,导致consumer0、consumer1需要重新消费之前正在处理的分区,导致不必要的系统开销。RoundRobinAssignor轮询策略是将消费组内所有消费者以及消费者所订阅的所有topic的partition按照字典序排序(topic和分区的hashcode进行排序),然后通过轮询方式逐个将分区以此分配给每个消费者。从Kafka 0.11.x开始,引入此类分配策略。原创 2022-11-01 16:59:40 · 509 阅读 · 0 评论 -
Python中关键字global与nonlocal的区别
上述代码定义了一个嵌套函数,其中,func为外层函数,func_in为内层函数。func函数中定义了一个变量count,func_in函数中对变量count重新赋值,并在func函数中输出count变量的值。在Python中,如果在函数内部对全局变量a进行修改,Python会把变量a当作是局部变量,而在进行“a+=100”之前,我们是没有声明局部变量a的,因此,程序会出现上述错误提示。若在函数作用域中需要修改全局作用域或外层嵌套作用域中的变量,则需要使用global和nonlocal关键字。原创 2022-10-25 17:27:14 · 1449 阅读 · 0 评论 -
Python中的集合关系都有哪些?
对于两个集合A与B,如果集合A中的所有元素都是集合B的元素,那么集合B包含集合A,也就是说集合A是集合B的子集,集合B是集合A的超集;如果集合A中的所有元素都是集合B中的元素,且集合B中至少有一个元素不属于集合A,那么集合A是集合B的真子集,集合B是集合A的真超集。除此之外,Python还提供了4个增强操作符:l=、-=、&=、“=,它们与前面4个操作符的区别是,前者是生成了一个新的集合,而后者是更新了位于操作符左侧的集合。(4)补集是指属于集合A和集合B但不同时属于两者的元素所组成的集合。原创 2022-09-28 17:08:36 · 719 阅读 · 0 评论 -
Kerberos是如何做身份认证的?
如,可以人为的添加一个客户端节点,并以此假冒的客户端来获取集群数据。① AS: authorization server , 授权服务,对于上面流程1,提供初始授权认证,用户表明需求并使用密码对请求进行加密,AS用提供的密码对请求进行解密后得到请求内容,返回给用户一个TGT(ticket granting tickets)(用一个秘钥加密)基于这样一个转换,我们可以得到一个关键信息: Kerberos 的身份认证其实是基于 ticket 来完成 的,就像看电影是基于电影票来进行验证的一样。原创 2022-09-16 15:56:54 · 239 阅读 · 0 评论 -
Python常见的数据分析工具有哪些?
Python本身的数据分析功能并不强,需要安装一些第三方的扩展库来增强它的能力。在Python培训课程用到的库包括NumPy、Pandas、Matplotlib、Seaborm、NLTK等,接下来将针对相关库做一个简单的介绍。NumPy是Python开源的数值计算扩展工具,它提供了Python对多维数组的支持,能够支持高级的维度数组与矩阵运算。此外,针对数组运算也提供了大量的数学函数库。NumPy是大部分Python科学计算的基础,它具有以下功能(1)快速高效的多维数据对象ndarray。...原创 2022-07-28 15:55:38 · 1606 阅读 · 0 评论 -
最新编程语言排行榜
最新编程排行榜原创 2022-06-22 15:05:42 · 881 阅读 · 0 评论 -
为什么Python这么受欢迎
Python一天比一天火,热度也在不断上升,很多人咨询python的时候都觉得python是跟人工智能分不开关系的,的确如此,但是关于python更多的资料就很少有人知道了,今天传智播客就给大家说说python到底是什么。什么是Python?Python是一门解释型、面向对象、带有动态语义的高级程序设计语言。在于1989年,由一位名叫Guido van Rossum(吉多.范罗苏姆),为打发时间设计了Python语言,第一个发行版公开于1991年。Python是一款纯粹的自由软件,源代码和解释器CP转载 2021-05-13 14:47:23 · 267 阅读 · 0 评论 -
Python常见的数据类型
变量用来存储数据,那么大家有没有想过,我们应该让变量占用多大空间,保存什么样的数据呢?在讲解变量的类型之前,我们先来看一个生活中的例子,例如,我们要运送一台电脑,大卡车和小轿车都可以完成,但是,如果使用大卡车运送一台电脑,显然有点小题大做,浪费了大卡车的空间,如图1所示。同理,如果使用变量存储数据时,为了更充分利用内存空间,我们可以为变量指定不同的数据类型。Python中常见的数据类型如图2所示。图2中罗列了Python中常见的数据类型,下面对这些数据类型进行一个简单介绍。(1)数字类型Pyth转载 2021-05-12 15:32:36 · 598 阅读 · 0 评论 -
Java面试题:Python中爬虫框架或模块的区别
(1)爬虫框架或模块Python自带爬虫模块:urllib、urllib2 ;第三方爬虫模块:requests,aiohttp;爬虫框架: Scrapy、pyspider。爬虫框架 Python爬虫基础,快速入门Scrapy爬虫框架 (2)爬虫框架或模块的优缺点urllib和urllib2模块都用于请求URL相关的操作,但他们提供了不同的功能。urllib2模块中urllib原创 2021-04-21 18:15:49 · 183 阅读 · 0 评论 -
使用Python语言开发爬虫有什么优势?
C/C++各种搜索引擎大多使用C/C++开发爬虫,可能是因为搜索引擎爬虫重要的是采集网站信息,对页面的解析要求不高。PythonPython语言的网络功能强大,能够模拟登陆,解析JavaScript,短处是网页解析。Python写起程序来很便捷,尤其是对聚焦爬虫,目标网站经常变换,要根据目标的变化修改爬虫程序,使用Python开发就显得很方便。JavaJava有很多解析器,对网页的解析支持很好,缺点是网络部分支持较差。对于一般性的需求,无论Java还是Python都可以胜任。如果需要模拟登陆,对原创 2021-04-21 14:45:31 · 308 阅读 · 0 评论 -
什么是python爬虫?学习python爬虫难不难?
什么是python爬虫?Python爬虫基础在了解python爬虫前,我们先来说说什么是爬虫。爬虫,又称网络爬虫,可以理解为蜘蛛在网络上爬行。互联网就像一个巨大的网络,爬虫就是在这个网络上爬行的蜘蛛。如果它们遇到了自己的猎物(需要的资源),它们就会把它抓下来。例如,当它抓取一个web页面时,它会找到一个路径,这个路径实际上是指向该web页面的超链接,因此它可以爬到另一个web页面以获取数据。python爬虫能做什么?python爬虫的应用主要有以下三个方面:1、爬取数据,进行市场调研和商业分析爬原创 2021-04-19 15:13:04 · 670 阅读 · 0 评论 -
Python做数据分析有哪些优势?
近年来,数据分析正在改变我们的工作方式,数据分析的相关工作也越来越受到人们的青睐。很多编程语言都可以做数据分析,比如Python、R、Matlab等,Python凭借着自身无可比拟的优势,被广泛地应用到数据科学领域中,并逐渐衍生为主流语言。选择Python做数据分析,主要考虑的是Python具有以下优势:(1)语法简单精炼,适合初学者入门600集Python从入门到精通教程(懂中文就能学会)比起其他编程语言,Python的语法非常简单,代码的可读性很高,非常有利于初学者的学习。例如,在处理数据的时候,原创 2021-04-16 11:40:06 · 2230 阅读 · 0 评论 -
python 有哪些优势
能用到Python 的地方非常多。无论是从入门级小白到专业级的大佬,数据挖掘、科学计算、图像处理、人工智能,Python 都可以胜任。或许是因为这种万能属性,现在有很多的小伙伴都开始学习 Python。万事开头难,给要学习python的同学开个好头,初入编程行业不清楚自己是否真的可以或者担心自己学不会.3天带你玩转Python深度学习python实战项目python爬虫热点项目那么在学习之前咱们得有一个明确的学习目标,详细的学习线路,做到不盲目学习,少走弯路。1、Python都被用在哪儿?自P原创 2021-04-14 14:56:29 · 102 阅读 · 0 评论 -
python零基础如何学习
学习的Python开发很难吗?适合于新手吗?python语言对于初学者是非常友好的,是编程语言中比较好学习一门编程语言。先分享一个关于Python+数据分析万能编程语言宝藏网站,贯穿数据始终学习路线图想要获得么?视频教程+难点技术解析+配套源码+学习工具+学习笔记等等,应有尽有python零基础入门到快速精通Python+数据分析由于以下原因,Python很适合作为零基础的学生学习:1.语法简单明了,Python语言实际上是语法+Flowcontrol,而Python的语法简单的代码可读性非常转载 2021-04-14 14:40:13 · 158 阅读 · 0 评论 -
2021年黑马程序员Python学习路线图
第一阶段:Python基础–从入门到精通(下面教程三选一即可)用甜美、清脆的声音伴随你快速入门Python。python入门教程_最适合零基础自学的Python教程受广大网友好评,听这套教程不会犯困,不会打盹。Python教程_600集Python从入门到精通教程(懂中文就能学会)2021新版Python,不一样的学习体验。Python小白基础入门教程 Python入门到精通教程第二阶段:Python进阶–Web核心技术针对python编程进一步所需要的知识点详细讲解,构建python语言的原创 2021-04-08 15:30:13 · 2964 阅读 · 0 评论