phtyon
文章平均质量分 81
、烟雨楼
这个作者很懒,什么都没留下…
展开
-
数据分析之机器Python高频面试题及答案
在学校的xxx课程上,我们是用的R语言进行编程,并且大作业是需要用R语言完成xxx项目,在这门课中我也从一个R语言小白成长了一点。清洗工作,在xx的实习/项目过程中,我用python中的numpy和pandas完成了xx量级的。1.numpy,用来做多维数组的运算的,之前在xx项目中用numpy做一些。numpy,用来做多维数组的运算的,之前在xx项目中用numpy做一些。python在我的实习中和项目中都是经常用的,在其中用python做。建模工作,在xxx的项目中,我用sklearn中的xxx。原创 2022-09-25 13:42:33 · 426 阅读 · 1 评论 -
Python 加速运行技巧
其会预分配一定内存空间,当预分配的内存空间用完,又继续向其中添加元素时,会申请一块更大的内存空间,然后将原有的所有元素都复制过去,之后销毁之前的内存空间,再插入新元素。因此,如果有频繁的新增、删除操作,新增、删除的元素数量又很多时,list的效率不高。如果你的代码运行速度很慢,首先要找到代码运行慢的位置,通常是内部循环,专注于运行慢的地方进行优化。底层都是 C 实现的,速度非常快,自己实现新的数据结构想在性能上达到内置的速度几乎是不可能的。原创 2022-09-22 14:46:58 · 111 阅读 · 0 评论 -
13个好用到起飞的Python技巧!
Python 是当今广泛使用的编程语言之一,在数据科学、科学计算、Web 开发、游戏开发和构建桌面图形界面等各个领域都有应用。Python 因其在各个领域的实用性、与 Java、C 和 C++ 等其他编程语言相比的生产力以及与英语类似的命令而广受欢迎。假如你也是Python学习爱好者,那么今天讲述的13个技巧,真挺香!原创 2022-09-22 14:43:05 · 107 阅读 · 0 评论 -
用漫画了解 Linux 内核到底长啥样
1111111111111111111111111111111111原创 2022-09-22 14:35:07 · 177 阅读 · 0 评论 -
超全整理!Linux 性能分析工具汇总
出于对Linux操作系统的兴趣,以及对底层知识的强烈欲望,因此整理了这篇文章。本文也可以作为检验基础知识的指标,另外文章涵盖了一个系统的方方面面。如果没有完善的计算机系统知识,网络知识和操作系统知识,文档中的工具,是不可能完全掌握的,另外对系统性能分析和优化是一个长期的系列。原创 2022-09-22 14:30:30 · 675 阅读 · 0 评论 -
Python 使用和高性能技巧总结
字符串拼接,例如 a + ':' + b + ':' + c 会创造大量无用的中间变量,':',join([a, b, c]) 效率会高不少。C/C++ 的习惯是把输入输出参数都列为函数的参数,通过指针改变输出参数的值,函数的返回值是执行状态,函数调用方对返回值进行检查,判断是否成功执行。在 Python 中,不需要函数调用方进行返回值检查,函数中遇到特殊情况,直接抛出一个异常。对别名的修改会影响原变量,(浅)复制中的元素是原列表中元素的别名,而深层复制是递归的进行复制,对深层复制的修改不影响原变量。原创 2022-09-22 14:25:33 · 86 阅读 · 0 评论 -
20个小技巧,让数据可视化图表更专业!
数据可视化是数据展示的常见方式,所谓一图抵千言,好的图表能高效传递信息,让观众一目了然,差的图表往往会不知所云。人类大脑的一半完全是用于处理可视化信息的。当你给用户展示一张信息图的时候,你已经以大脑的最大带宽路径在影响他了。一张设计优良的数据可视化图能即时给予观者深刻的印象,并能穿透一个复杂故事的芜杂直抵问题的核心。众所周知,纽约时报的可视化图表非常专业,既能阐述事实,也不失简洁美观。作为普通人,其实只要遵守一些设计规则,加上一点审美训练,也能制作出专业的可视化图表。原创 2022-09-22 14:21:58 · 125 阅读 · 0 评论 -
总结了 50 个最有价值的数据可视化图表
本文总结了在数据分析和可视化中最有用的 50 个 Matplotlib 图表。这些图表列表可以使用 python 的 matplotlib 和 seaborn 库选择要显示的可视化对象。例如,如果要想象两个变量之间的关系,请查看“关联”部分下的图表。或者,如果您想要显示值如何随时间变化,请查看“变化”部分,依此类推。原创 2022-09-22 14:19:23 · 370 阅读 · 0 评论 -
Python 数据可视化的 3 大步骤,你知道吗?
原始图形画完后,我们可以根据需求修改颜色(color),线型(linestyle),标记(maker)或者其他图表装饰项标题(Title),轴标签(xlabel,ylabel),轴刻度(set_xticks),还有图例(legend)等,让图形更加直观。Pandas中有许多基于matplotlib的高级绘图方法,原本需要多行代码才能搞定的图表,使用pandas只需要短短几行。,是一个最基础的Python可视化库,一般都是从matplotlib上手Python数据可视化,然后开始做纵向与横向拓展。原创 2022-09-22 14:10:40 · 125 阅读 · 0 评论 -
Python中关闭文件很重要
首先因为受系统的限制,我们不管用哪种语言编程,都要把不在使用的文件描述符关闭,一来避免因开启文件过多导致服务异常,二来及时关闭不用的文件描述符也能节约资源。另外我们永远无法完全避免崩溃的影响,但是我们可以通过使用上下文管理器来减少崩溃带来的影响。咱们下期见!答案获取方式:已赞 已评 已关~学习更多知识与技巧,关注与私信博主(03)原创 2022-09-22 13:34:18 · 1147 阅读 · 0 评论 -
我总结的80页《菜鸟学Python精选干货.pdf》,都是干货
这份资料来自我们的小密圈,我们公众号有一个内部的小密圈,里面有1000多人,累计发布了很多干货在里面,运营了有2年的时间,假期整理了一份,献给大家,希望这些干货对大家有帮助。4).文件读写,有没有try/except5).拿到一个句柄,比如SSH,SQL,这样有没有考虑到句柄的有效性。原创 2022-09-21 14:22:57 · 134 阅读 · 0 评论 -
万字长文Python面试题
Python 中默认是贪婪匹配模式。贪婪模式:正则表达式一般趋向于最大长度匹配。非贪婪模式:在整个表达式匹配成功的前提下,尽可能少的匹配。该库是发起 HTTP 请求的强大类库,调用简单,功能强大。response = requests.get(url) # 获得请求response.encoding = "utf-8" # 改变其编码html = response.text # 获得网页内容binary__content = response.content # 获得二进制数据。原创 2022-09-21 14:18:14 · 1221 阅读 · 1 评论 -
精心整理了 170 道 Python 面试题
Python 中默认是贪婪匹配模式贪婪模式:正则表达式一般趋向于最大长度匹配非贪婪模式:在整个表达式匹配成功的前提下,尽可能少的匹配该库是发起 HTTP 请求的强大类库,调用简单,功能强大response = requests.get(url) # 获得请求response.encoding = "utf-8" # 改变其编码html = response.text # 获得网页内容binary__content = response.content # 获得二进制数据。原创 2022-09-21 14:07:05 · 413 阅读 · 0 评论 -
Alibaba 内部的 python 入门到精通背记手册 + 面试宝典
如其来的新冠肺炎疫情打乱了各行业发展的节奏,但 5G 的到来带动了 人工智能、大数据、物联网、云计算的快速发展,也衍生出了很多新兴产业和新 的工作岗位。2020 年全国 Python 软件工程师人才缺口已达百万,各行各业的企业迫切 需要综合能力水平超强的 Python 编程技术人才,来应对日新月异的市场发展 需求。原创 2022-09-21 13:50:27 · 176 阅读 · 0 评论 -
Python 中的文本分类,2022Python 面试真题精选干货整理
Python 崛起并且风靡,因为优点多、应用领域广、被大牛们认可。学习 Python 门槛很低,但它的晋级路线很多,通过它你能进入机器学习、数据挖掘、大数据,CS 等更加高级的领域。Python 可以做网络应用,可以做科学计算,数据分析,可以做网络爬虫,可以做机器学习、自然语言处理、可以写游戏、可以做桌面应用…Python 可以做的很多,你需要学好基础,再选择明确的方向。这里给大家分享一份全套的 Python 学习资料,给那些想学习 Python 的小伙伴们一点帮助!??Python 所有方向的学习路线。原创 2022-09-21 13:40:20 · 343 阅读 · 0 评论 -
300道Python面试题
不过在实际项目工程中,Python 很多时候作为脚本语言使用,如果再深入分解可能又回归到上面的那些技术岗位了,比如在 AI 团队中负责算法实现部分,那从 Python 的基础到高级,数据结构,数据分析等一系列内容都需要掌握。这份面试题中,不仅有代码题,还有一些问答题,这些答案通通都有,所以免去找答案的时间。随着这两年人工智能的火爆趋势,Python 的发展势头已然无法阻挡,想进入人工智能,Python已经成为必修基础开发语言了,不过这部分题目并不是很多,希望作者以后可以继续补充这部分内容,惠利大家。原创 2022-09-21 13:31:42 · 917 阅读 · 1 评论 -
经典面试题 -Python 装饰器
面试官通常会问: 1. python 装饰器是什么?其作用是什么?2. 装饰器的原理与实现?本质就是封装了一个闭包函数,在函数、方法或者类的定义上方添加@装饰器名称进行使用。优化代码的可读性,可维护性:咱们下期见!答案获取方式:已赞 已评 已关~学习更多知识与技巧,关注与私信博主(03)原创 2022-09-21 13:28:14 · 624 阅读 · 0 评论 -
真实 Python 爬虫面试题
11. 假设有如下两个 list:a = ['a', 'b', 'c', 'd', 'e'],b = [1, 2, 3, 4, 5],将 a 中的元素作为 key,b 中元素作为 value,将 a,b 合并为字典。5. 如果 custname 字符串的内容为 utf-8 的字符,如何将 custname 的内容转为 gb18030 的字符串?3. 有一个升序后又降序的数组,比如 1356742,如何查找到 2 的位置。原创 2022-09-21 13:04:28 · 170 阅读 · 0 评论 -
惊艳!Python3 的这几个特性
所以在Python3彻底解决的这种情况,首先Python3使用utf-8作为默认编码,这样就兼容了所有字符,无论是中文、日文、韩文还是火星文都可以表示了,此外,str和byte两种类型做了明确的区分,因此,使用Python3可解决99%的编码错误问题。Python虽然提高的开发的效率,但是带来的代价就是程序性能上的损耗,因为它是一种解释型语言,速度上自然比不上静态语言,与此同时,Python天生的GIL语言,并不能充分利用多核CPU,使得程序可以并行执行。所以,多线程面对计算密集型场景成了鸡肋。原创 2022-09-20 14:43:31 · 284 阅读 · 0 评论 -
Python的22个编程技巧,简化 if 语句、开启文件分享……
这是一个我们大多数人不知道的有用特性,在 Python 控制台,不论何时我们测试一个表达式或者调用一个方法,结果都会分配给一个临时变量: _(一个下划线)。我们可以使用列表来初始化多个变量,在解析列表时,变量的数目不应该超过列表中的元素个数:【译者注:元素个数与列表长度应该严格相同,不然会报错】上面的命令会在默认端口也就是 8000 开启一个服务器,你可以将一个自定义的端口号以最后一个参数的方式传递到上面的命令中。在上面的例子里 classA 与 classB 是两个类,其中一个类的构造函数会被调用。原创 2022-09-20 14:41:23 · 264 阅读 · 0 评论 -
20行python代码实现鸡汤智能生成器
不要去想不可能之事”“努力赢得自己的幸福和世界”“我们想要结束的创造却造就了大地,唯你抱以温情”“仰望奇迹,放弃幻想”但其实上面这些鸡汤句子全都是电脑生成的,而且其生成鸡汤文所用的程序还不到 20 行 Python 代码。一提到自然语言生成,人们通常会觉得这一定是很先进的 AI 系统,使用了很高级的数学知识。但是,事实并非如此。在本文我(作者 Ramtin Alami——译者注)会用马尔科夫链(Markov chains)和一个很小的鸡汤文数据集生成新的鸡汤文。原创 2022-09-21 13:04:46 · 287 阅读 · 0 评论 -
Python-爬虫工程师-面试题总结
(从而导致内存泄露)。python内部使用引用计数,来保持追踪内存中的对象,Python内部记录了对象有多少个引用,即引用计数,当对象被创建时就创建了一个引用计数,当对象不再需要时,这个对象的引用计数为0时,它被垃圾回收。创建一个新的对象,但它包含的是对原始对象中包含项的引用(如果用引用的方式修改其中一个对象,另外一个也会修改改变){1,完全切片方法;__name__是当前模块名,当模块被直接运行时模块名为_main_,也就是当前的模块,当模块被导入时,模块名就不是__main__,即代码将不会执行。原创 2022-09-20 14:36:23 · 251 阅读 · 0 评论 -
搞定这套Python爬虫面试题,面试轻轻松松!
新创建的对象都会分配在年轻代,年轻代链表的总数达到上限时,Python垃圾收集机制就会被触发,把那些可以被回收的对象回收掉,而那些不会回收的对象就会被移到中年代去,依此类推,老年代中的对象是存活时间最久的对象,甚至是存活于整个系统的生命周期内。根对象就是全局变量、调用栈、寄存器。在上图中,我们把小黑圈视为全局变量,也就是把它作为root object,从小黑圈出发,对象1可直达,那么它将被标记,对象2、3可间接到达也会被标记,而4和5不可达,那么1、2、3就是活动对象,4和5是非活动对象会被GC回收。原创 2022-09-20 14:30:08 · 1153 阅读 · 0 评论 -
常见的python与爬虫面试题准备好了
init:对象初始化方法new:创建对象时候执行的方法,单列模式会用到str:当使用print输出对象的时候,只要自己定义了str(self)方法,那么就会打印从在这个方法中return的数据del:删除对象执行的方法散列函数(英语:Hash function)又称散列算法、哈希函数,是一种从任何一种数据中创建小的数字 “指纹”的方法。散列函数把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。原创 2022-09-20 14:27:58 · 1151 阅读 · 0 评论 -
157条超实用Python代码实例。问题+实例解答+原理解析+补充知识
这份资料旨在解决Python实际工作、学习场景中的具体问题,深入了解Python语言特性。大多没有编程经验的同学,做Python练习的时候,习惯搜题背题,没有去理解题目思考结题思路。创建脚本文件的基础知识。复杂语句(if、while、for、try、whth和raise)不同类型的数字、字符串、元组和Python的基本内置类型的使用方法。函数定义技巧、利用typing模块为函数创建更正式的注释。用python的各种数据结构解决问题---列表、集、字典。Python实现大规模、复杂的复合应用程序的设计方法。原创 2022-09-20 14:23:27 · 646 阅读 · 0 评论 -
Python 爬虫:一些常用的爬虫技巧总结
用 python 也差不多一年多了,python 应用最多的场景还是 web 快速开发、爬虫、自动化运维:写过简单网站、写过自动发帖脚本、写过收发邮件脚本、写过简单验证码识别脚本。爬虫在开发过程中也有很多复用的过程,这里总结一下,以后也能省些事情。原创 2022-09-20 14:11:51 · 194 阅读 · 0 评论 -
谈谈对Python爬虫的理解
爬虫是一个程序,这个程序的目的就是为了抓取万维网信息资源,比如你日常使用的谷歌等搜索引擎,搜索结果就全都依赖爬虫来定时获取看上述搜索结果,除了wiki相关介绍外,爬虫有关的搜索结果全都带上了Python,前人说Python爬虫,现在看来果然诚不欺我~爬虫的目标对象也很丰富,不论是文字、图片、视频,任何结构化非结构化的数据爬虫都可以爬取,爬虫经过发展,也衍生出了各种爬虫类型:通用网络爬虫:爬取对象从一些种子 URL 扩充到整个 Web,搜索引擎干的就是这些事。原创 2022-09-20 14:08:57 · 557 阅读 · 0 评论 -
Python爬虫之BeautifulSoup4使用
首先说说BeautifulSoup是什么。简单来说,这是Python的一个HTML或XML的解析库,我们可以用它方便从网页中提取数据,官方解释如下:BeautifulSoup 提供一些简单的、Python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。BeautifulSoup 自动将输入文档转换为 Unicode 编码,输出文档转换为 utf-8 编码。原创 2022-09-20 14:00:41 · 274 阅读 · 0 评论 -
Netty、Kafka中的零拷贝技术到底有多牛?
Netty 提供了零拷贝的 Buffer,在传输数据时,最终处理的数据会需要对单个传输的报文,进行组合和拆分,NIO 原生的 ByteBuffer 无法做到,Netty 通过提供的 Composite(组合)和 Slice(拆分)两种 Buffer 来实现零拷贝。使用 mmap+write 方式代替原来的 read+write 方式,mmap 是一种内存映射文件的方法,即将一个文件或者其他对象映射到进程的地址空间,实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对应关系。原创 2022-09-20 13:52:55 · 155 阅读 · 0 评论 -
Python数据处理入门教程!
本教程内容旨在帮助没有基础的同学。可作为机器学习或深度学习的先修课程,也可作为快速备查手册。值得一提的是,,可以说 numpy 玩儿熟了,几个深度学习框架的不少 API 也同时学会了。本文是教程的「第一部分」,从实际的代码应用出发,讲解了Numpy创建到统计的操作。则如下:· 偏实用高频 API· 展示实际用法· 简单直接使用说明:内容中⭐(1-5个)表示重要程度,越多越重要;⚠️ 表示需要特别注意的。原创 2022-09-19 15:21:17 · 239 阅读 · 0 评论 -
阿里最强 Python 自动化工具开源了!
阿里这款 iOS 端自动化工具的主要优点是启动速度快,内存占用低;更重要的是,它是跨平台,稳定性相对较高咱们下期见!答案获取方式:已赞 已评 已关~学习更多知识与技巧,关注与私信博主(03)原创 2022-09-19 15:19:16 · 266 阅读 · 0 评论 -
如何把Python应用构建为Docker容器
至此, Python应用的容器化就已经介绍完毕, 但是这只是一个简单的开始, 后面需要慢慢的了解多机的容器应用的怎么控制和执行的。咱们下期见!答案获取方式:已赞 已评 已关~学习更多知识与技巧,关注与私信博主(03)原创 2022-09-19 15:13:13 · 1141 阅读 · 0 评论 -
博采 27 门语言之长,提升 Python 的能力
Python猫注:Python 语言诞生 30 年了,如今的发展势头可谓如火如荼,这很大程度上得益于其易学易用的优秀设计,而不可否认的是,Python 从其它语言中偷师了不少。本文作者是一名资深的核心开发者,他广博的视野和精准的认识,让我对 Python 的设计了解得更为全面,同时,他“利用自豪感而非恐惧感”的说法,传达出来的是“专注于自我的进步,不嫉妒他人的成功”的原则,对我也很有帮助。最后祝大家开卷有益,读有所获。作者:Nick Coghlan译者:豌豆花下猫@Python猫。原创 2022-09-19 14:46:58 · 526 阅读 · 0 评论 -
一个小破网站,居然比 Python 官网还牛逼
前两天,我发现有个前同事写的 Shell 脚本经常在出问题,考虑这个脚本一直挺不稳定的,维护起来也挺头疼,原因是 Shell 脚本写稍微复杂一点的逻辑,代码就变得十分臃肿,对比 Python 真的太差劲了。这个 Shell 脚本中有一个功能是检查机器上的 rpm 包与中心端的包版本进行对比,在本地用 Shell 取 rpm 信息很方便,但要取 rpm 包版本,其实是很难的。原因是 rpm 包的版本格式分非常多种,根本无法使用简单的字符串分割来取得具体的版本号,更不用说版本对比。原创 2022-09-19 14:43:23 · 266 阅读 · 0 评论 -
浏览器可以运行 Python 代码了,Python 也许会变成前后端通吃的语言
PyScript[1] 是 Anaconda 团队开发的一个 Javascipt 库,可以在 HTML 标签里嵌入 Python 代码,无需服务端就可以运行 Python 代码。比如说,我们用 Python 在页面上显示日期,先编写一个 hello_world.html 文件,内容如下:用浏览器打开,其运行效果就是这样的:这意味着,我们可以在 HTML 中编写和运行 Python 代码, 在 PyScript 中调用 Javascript 库,并在 Python 中完成所有 Web 开发。原创 2022-09-19 14:39:08 · 325 阅读 · 0 评论 -
一文概览 NLP 算法(Python)
这里,贴一张自然语言处理的技术路线图,介绍了NLP任务及主流模型的分支:高清图可如下路径下载(原作者graykode):https://github.com/aialgorithm/AiPy/tree/master/Ai%E7%9F%A5%E8%AF%86%E5%9B%BE%E5%86%8C/Ai_Roadmap。原创 2022-09-19 14:33:37 · 303 阅读 · 0 评论 -
最强Python面试题之Python基础题
Python 自省是 Python 具有的一种能力,使程序员面向对象的语言所写的程序在运行时,能够获得对象的类 Python 型。Python 是一种解释型语言,为程序员提供了极大的灵活性和控制力。命名空间,又名 namesapce,是在很多的编程语言中都会出现的术语,趁着这个题顺便给大家仔细介绍一下。全局变量 & 局部变量全局变量和局部变量是我们理解命名空间的开始,我们先来看一段代码:1234567x =2x =3print(,x)func()print(,x)原创 2022-09-19 14:20:33 · 340 阅读 · 0 评论 -
附答案 | 最强Python面试题之爬虫框架问题
增量爬取即保存上一次状态,本次抓取时与上次比对,如果不在上次的状态中,便视为增量,保存下来。对于 scrapy 来说,上一次的状态是抓取的特征数据和上次爬取的 request 队列(url 列表),request 队列可以通过 request 队列可以通过 scrapy.core.scheduler 的 pending_requests 成员得到,在爬虫启动时导入上次爬取的特征数据,并且用上次 request 队列的数据作为 start url 进行爬取,不在上一次状态中的数据便保存。原创 2022-09-18 14:06:29 · 385 阅读 · 0 评论 -
Python入门难吗?30年前的编程语言,为什么现在这么火?
再过去的很长一段时间, C、C++、C# 和 Java 等编程语言在各大排行榜的头部位置上上下下。然而,在近几年,Python 越来越受到关注。最近几个月 Python 在 Tiobe 的编程语言指数中长期领先于 Java、C#、C++ 和 Visual Basic 等语言,占据榜单第二的位置。如最新的2021年8月TIOBE编程语言排行榜中,Python 仍然是位于 C 语言之下、Java 之上,排在第二名。那么回到问题,Python 为什么这么火呢?文章不长,看完下文你就会明白:像大多数编程语言一样,在原创 2022-09-18 13:58:01 · 161 阅读 · 0 评论 -
Python 从入门到精通:一个月就够了
如果你是个技术小白,安装 Python 环境可不是你的首要任务。如果你有一份全职工作,或者你是一名学生,完成这些流程可能需要更长的时间。你所要做的就是精通一两件事,并且熟悉其它的事情,最终通过面试。如果你能在 28 天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名程序员的正确特征了。你不需要掌握所有的知识,但是你应该知道一些常识,因为它们会影响你的日常工作。要知道,一个月是一段很长的时间。如果你非常「疯狂」,并且非常专注,你可以在一个月内完成这些任务。原创 2022-09-18 13:52:55 · 180 阅读 · 0 评论