语言
文章平均质量分 81
、烟雨楼
这个作者很懒,什么都没留下…
展开
-
经典面试题 -Python 装饰器
面试官通常会问: 1. python 装饰器是什么?其作用是什么?2. 装饰器的原理与实现?本质就是封装了一个闭包函数,在函数、方法或者类的定义上方添加@装饰器名称进行使用。优化代码的可读性,可维护性:咱们下期见!答案获取方式:已赞 已评 已关~学习更多知识与技巧,关注与私信博主(03)原创 2022-09-21 13:28:14 · 647 阅读 · 0 评论 -
真实 Python 爬虫面试题
11. 假设有如下两个 list:a = ['a', 'b', 'c', 'd', 'e'],b = [1, 2, 3, 4, 5],将 a 中的元素作为 key,b 中元素作为 value,将 a,b 合并为字典。5. 如果 custname 字符串的内容为 utf-8 的字符,如何将 custname 的内容转为 gb18030 的字符串?3. 有一个升序后又降序的数组,比如 1356742,如何查找到 2 的位置。原创 2022-09-21 13:04:28 · 181 阅读 · 0 评论 -
惊艳!Python3 的这几个特性
所以在Python3彻底解决的这种情况,首先Python3使用utf-8作为默认编码,这样就兼容了所有字符,无论是中文、日文、韩文还是火星文都可以表示了,此外,str和byte两种类型做了明确的区分,因此,使用Python3可解决99%的编码错误问题。Python虽然提高的开发的效率,但是带来的代价就是程序性能上的损耗,因为它是一种解释型语言,速度上自然比不上静态语言,与此同时,Python天生的GIL语言,并不能充分利用多核CPU,使得程序可以并行执行。所以,多线程面对计算密集型场景成了鸡肋。原创 2022-09-20 14:43:31 · 295 阅读 · 0 评论 -
Python的22个编程技巧,简化 if 语句、开启文件分享……
这是一个我们大多数人不知道的有用特性,在 Python 控制台,不论何时我们测试一个表达式或者调用一个方法,结果都会分配给一个临时变量: _(一个下划线)。我们可以使用列表来初始化多个变量,在解析列表时,变量的数目不应该超过列表中的元素个数:【译者注:元素个数与列表长度应该严格相同,不然会报错】上面的命令会在默认端口也就是 8000 开启一个服务器,你可以将一个自定义的端口号以最后一个参数的方式传递到上面的命令中。在上面的例子里 classA 与 classB 是两个类,其中一个类的构造函数会被调用。原创 2022-09-20 14:41:23 · 275 阅读 · 0 评论 -
20行python代码实现鸡汤智能生成器
不要去想不可能之事”“努力赢得自己的幸福和世界”“我们想要结束的创造却造就了大地,唯你抱以温情”“仰望奇迹,放弃幻想”但其实上面这些鸡汤句子全都是电脑生成的,而且其生成鸡汤文所用的程序还不到 20 行 Python 代码。一提到自然语言生成,人们通常会觉得这一定是很先进的 AI 系统,使用了很高级的数学知识。但是,事实并非如此。在本文我(作者 Ramtin Alami——译者注)会用马尔科夫链(Markov chains)和一个很小的鸡汤文数据集生成新的鸡汤文。原创 2022-09-21 13:04:46 · 301 阅读 · 0 评论 -
Python-爬虫工程师-面试题总结
(从而导致内存泄露)。python内部使用引用计数,来保持追踪内存中的对象,Python内部记录了对象有多少个引用,即引用计数,当对象被创建时就创建了一个引用计数,当对象不再需要时,这个对象的引用计数为0时,它被垃圾回收。创建一个新的对象,但它包含的是对原始对象中包含项的引用(如果用引用的方式修改其中一个对象,另外一个也会修改改变){1,完全切片方法;__name__是当前模块名,当模块被直接运行时模块名为_main_,也就是当前的模块,当模块被导入时,模块名就不是__main__,即代码将不会执行。原创 2022-09-20 14:36:23 · 266 阅读 · 0 评论 -
搞定这套Python爬虫面试题,面试轻轻松松!
新创建的对象都会分配在年轻代,年轻代链表的总数达到上限时,Python垃圾收集机制就会被触发,把那些可以被回收的对象回收掉,而那些不会回收的对象就会被移到中年代去,依此类推,老年代中的对象是存活时间最久的对象,甚至是存活于整个系统的生命周期内。根对象就是全局变量、调用栈、寄存器。在上图中,我们把小黑圈视为全局变量,也就是把它作为root object,从小黑圈出发,对象1可直达,那么它将被标记,对象2、3可间接到达也会被标记,而4和5不可达,那么1、2、3就是活动对象,4和5是非活动对象会被GC回收。原创 2022-09-20 14:30:08 · 1181 阅读 · 0 评论 -
常见的python与爬虫面试题准备好了
init:对象初始化方法new:创建对象时候执行的方法,单列模式会用到str:当使用print输出对象的时候,只要自己定义了str(self)方法,那么就会打印从在这个方法中return的数据del:删除对象执行的方法散列函数(英语:Hash function)又称散列算法、哈希函数,是一种从任何一种数据中创建小的数字 “指纹”的方法。散列函数把消息或数据压缩成摘要,使得数据量变小,将数据的格式固定下来。原创 2022-09-20 14:27:58 · 1164 阅读 · 0 评论 -
157条超实用Python代码实例。问题+实例解答+原理解析+补充知识
这份资料旨在解决Python实际工作、学习场景中的具体问题,深入了解Python语言特性。大多没有编程经验的同学,做Python练习的时候,习惯搜题背题,没有去理解题目思考结题思路。创建脚本文件的基础知识。复杂语句(if、while、for、try、whth和raise)不同类型的数字、字符串、元组和Python的基本内置类型的使用方法。函数定义技巧、利用typing模块为函数创建更正式的注释。用python的各种数据结构解决问题---列表、集、字典。Python实现大规模、复杂的复合应用程序的设计方法。原创 2022-09-20 14:23:27 · 659 阅读 · 0 评论 -
Python 爬虫:一些常用的爬虫技巧总结
用 python 也差不多一年多了,python 应用最多的场景还是 web 快速开发、爬虫、自动化运维:写过简单网站、写过自动发帖脚本、写过收发邮件脚本、写过简单验证码识别脚本。爬虫在开发过程中也有很多复用的过程,这里总结一下,以后也能省些事情。原创 2022-09-20 14:11:51 · 204 阅读 · 0 评论 -
谈谈对Python爬虫的理解
爬虫是一个程序,这个程序的目的就是为了抓取万维网信息资源,比如你日常使用的谷歌等搜索引擎,搜索结果就全都依赖爬虫来定时获取看上述搜索结果,除了wiki相关介绍外,爬虫有关的搜索结果全都带上了Python,前人说Python爬虫,现在看来果然诚不欺我~爬虫的目标对象也很丰富,不论是文字、图片、视频,任何结构化非结构化的数据爬虫都可以爬取,爬虫经过发展,也衍生出了各种爬虫类型:通用网络爬虫:爬取对象从一些种子 URL 扩充到整个 Web,搜索引擎干的就是这些事。原创 2022-09-20 14:08:57 · 581 阅读 · 0 评论 -
Python爬虫之BeautifulSoup4使用
首先说说BeautifulSoup是什么。简单来说,这是Python的一个HTML或XML的解析库,我们可以用它方便从网页中提取数据,官方解释如下:BeautifulSoup 提供一些简单的、Python 式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。BeautifulSoup 自动将输入文档转换为 Unicode 编码,输出文档转换为 utf-8 编码。原创 2022-09-20 14:00:41 · 287 阅读 · 0 评论 -
Netty、Kafka中的零拷贝技术到底有多牛?
Netty 提供了零拷贝的 Buffer,在传输数据时,最终处理的数据会需要对单个传输的报文,进行组合和拆分,NIO 原生的 ByteBuffer 无法做到,Netty 通过提供的 Composite(组合)和 Slice(拆分)两种 Buffer 来实现零拷贝。使用 mmap+write 方式代替原来的 read+write 方式,mmap 是一种内存映射文件的方法,即将一个文件或者其他对象映射到进程的地址空间,实现文件磁盘地址和进程虚拟地址空间中一段虚拟地址的一一对应关系。原创 2022-09-20 13:52:55 · 164 阅读 · 0 评论 -
Python数据处理入门教程!
本教程内容旨在帮助没有基础的同学。可作为机器学习或深度学习的先修课程,也可作为快速备查手册。值得一提的是,,可以说 numpy 玩儿熟了,几个深度学习框架的不少 API 也同时学会了。本文是教程的「第一部分」,从实际的代码应用出发,讲解了Numpy创建到统计的操作。则如下:· 偏实用高频 API· 展示实际用法· 简单直接使用说明:内容中⭐(1-5个)表示重要程度,越多越重要;⚠️ 表示需要特别注意的。原创 2022-09-19 15:21:17 · 249 阅读 · 0 评论 -
阿里最强 Python 自动化工具开源了!
阿里这款 iOS 端自动化工具的主要优点是启动速度快,内存占用低;更重要的是,它是跨平台,稳定性相对较高咱们下期见!答案获取方式:已赞 已评 已关~学习更多知识与技巧,关注与私信博主(03)原创 2022-09-19 15:19:16 · 276 阅读 · 0 评论 -
如何把Python应用构建为Docker容器
至此, Python应用的容器化就已经介绍完毕, 但是这只是一个简单的开始, 后面需要慢慢的了解多机的容器应用的怎么控制和执行的。咱们下期见!答案获取方式:已赞 已评 已关~学习更多知识与技巧,关注与私信博主(03)原创 2022-09-19 15:13:13 · 1165 阅读 · 0 评论 -
博采 27 门语言之长,提升 Python 的能力
Python猫注:Python 语言诞生 30 年了,如今的发展势头可谓如火如荼,这很大程度上得益于其易学易用的优秀设计,而不可否认的是,Python 从其它语言中偷师了不少。本文作者是一名资深的核心开发者,他广博的视野和精准的认识,让我对 Python 的设计了解得更为全面,同时,他“利用自豪感而非恐惧感”的说法,传达出来的是“专注于自我的进步,不嫉妒他人的成功”的原则,对我也很有帮助。最后祝大家开卷有益,读有所获。作者:Nick Coghlan译者:豌豆花下猫@Python猫。原创 2022-09-19 14:46:58 · 549 阅读 · 0 评论 -
一个小破网站,居然比 Python 官网还牛逼
前两天,我发现有个前同事写的 Shell 脚本经常在出问题,考虑这个脚本一直挺不稳定的,维护起来也挺头疼,原因是 Shell 脚本写稍微复杂一点的逻辑,代码就变得十分臃肿,对比 Python 真的太差劲了。这个 Shell 脚本中有一个功能是检查机器上的 rpm 包与中心端的包版本进行对比,在本地用 Shell 取 rpm 信息很方便,但要取 rpm 包版本,其实是很难的。原因是 rpm 包的版本格式分非常多种,根本无法使用简单的字符串分割来取得具体的版本号,更不用说版本对比。原创 2022-09-19 14:43:23 · 276 阅读 · 0 评论 -
浏览器可以运行 Python 代码了,Python 也许会变成前后端通吃的语言
PyScript[1] 是 Anaconda 团队开发的一个 Javascipt 库,可以在 HTML 标签里嵌入 Python 代码,无需服务端就可以运行 Python 代码。比如说,我们用 Python 在页面上显示日期,先编写一个 hello_world.html 文件,内容如下:用浏览器打开,其运行效果就是这样的:这意味着,我们可以在 HTML 中编写和运行 Python 代码, 在 PyScript 中调用 Javascript 库,并在 Python 中完成所有 Web 开发。原创 2022-09-19 14:39:08 · 338 阅读 · 0 评论 -
一文概览 NLP 算法(Python)
这里,贴一张自然语言处理的技术路线图,介绍了NLP任务及主流模型的分支:高清图可如下路径下载(原作者graykode):https://github.com/aialgorithm/AiPy/tree/master/Ai%E7%9F%A5%E8%AF%86%E5%9B%BE%E5%86%8C/Ai_Roadmap。原创 2022-09-19 14:33:37 · 320 阅读 · 0 评论 -
最强Python面试题之Python基础题
Python 自省是 Python 具有的一种能力,使程序员面向对象的语言所写的程序在运行时,能够获得对象的类 Python 型。Python 是一种解释型语言,为程序员提供了极大的灵活性和控制力。命名空间,又名 namesapce,是在很多的编程语言中都会出现的术语,趁着这个题顺便给大家仔细介绍一下。全局变量 & 局部变量全局变量和局部变量是我们理解命名空间的开始,我们先来看一段代码:1234567x =2x =3print(,x)func()print(,x)原创 2022-09-19 14:20:33 · 347 阅读 · 0 评论 -
附答案 | 最强Python面试题之爬虫框架问题
增量爬取即保存上一次状态,本次抓取时与上次比对,如果不在上次的状态中,便视为增量,保存下来。对于 scrapy 来说,上一次的状态是抓取的特征数据和上次爬取的 request 队列(url 列表),request 队列可以通过 request 队列可以通过 scrapy.core.scheduler 的 pending_requests 成员得到,在爬虫启动时导入上次爬取的特征数据,并且用上次 request 队列的数据作为 start url 进行爬取,不在上一次状态中的数据便保存。原创 2022-09-18 14:06:29 · 395 阅读 · 0 评论 -
Python入门难吗?30年前的编程语言,为什么现在这么火?
再过去的很长一段时间, C、C++、C# 和 Java 等编程语言在各大排行榜的头部位置上上下下。然而,在近几年,Python 越来越受到关注。最近几个月 Python 在 Tiobe 的编程语言指数中长期领先于 Java、C#、C++ 和 Visual Basic 等语言,占据榜单第二的位置。如最新的2021年8月TIOBE编程语言排行榜中,Python 仍然是位于 C 语言之下、Java 之上,排在第二名。那么回到问题,Python 为什么这么火呢?文章不长,看完下文你就会明白:像大多数编程语言一样,在原创 2022-09-18 13:58:01 · 171 阅读 · 0 评论 -
Python 从入门到精通:一个月就够了
如果你是个技术小白,安装 Python 环境可不是你的首要任务。如果你有一份全职工作,或者你是一名学生,完成这些流程可能需要更长的时间。你所要做的就是精通一两件事,并且熟悉其它的事情,最终通过面试。如果你能在 28 天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名程序员的正确特征了。你不需要掌握所有的知识,但是你应该知道一些常识,因为它们会影响你的日常工作。要知道,一个月是一段很长的时间。如果你非常「疯狂」,并且非常专注,你可以在一个月内完成这些任务。原创 2022-09-18 13:52:55 · 187 阅读 · 0 评论 -
如何更加深入地学习Python?
很多初学者不懂什么是高级数据结构,也不懂什么是面向对象编程,然后选择跳过,殊不知这两个名词在整个学习的过程中占有很高的地位,碰到诸如此类的问题,应立刻百度或者Google,学习并了解其中的含义,深究虽说占用时间比较长,但一定程度上可以夯实开发者的基础。Python有最全的库和框架,这是其他语言所不具备的,作为开发人员也要把这一特点发扬光大,不要局限于一种技术,比如学会了Django,那就接着把Flask也学会,如果Web开发的框架都应用自如,就去学学其他领域的框架。坚持不懈写代码,会形成编程的思维习惯。原创 2022-09-18 13:49:43 · 236 阅读 · 0 评论 -
Python 处理 PDF 的神器 - PyMuPDF
在介绍PyMuPDF之前,先来了解一下MuPDF,从命名形式中就可以看出,PyMuPDF是MuPDF的Python接口形式。MuPDFMuPDF是一个轻量级的PDF、XPS和电子书查看器。MuPDF由软件库、命令行工具和各种平台的查看器组成。MuPDF中的渲染器专为高质量抗锯齿图形量身定制。它以精确到像素的几分之一内的度量和间距呈现文本,以在屏幕上再现打印页面的外观时获得最高保真度。这个观察器很小,速度很快,但是很完整。它支持多种文档格式,如PDF、XPS、OpenXPS、CBZ、EPUB和。原创 2022-09-18 13:42:39 · 284 阅读 · 0 评论 -
弃繁就简!一行代码搞定 Python 日志!
有需求就有实现,但是能把需求实现得这么优雅、简洁的,我只服这个 loguru 的作者。而且还附加了许多非常有用的功能,简直是个鬼才!咱们下期见!答案获取方式:已赞 已评 已关~学习更多知识与技巧,关注与私信博主(03)原创 2022-09-18 13:37:00 · 226 阅读 · 1 评论 -
Python核心知识点速查表,长图+26页pdf
有同学问到有没有 Python 的速查表可以供学习的。类似的速查表,目前,我已经出了《Markdown速查表》、《Python字符串速查表》等,还没有比较完整的Python版本的。Python字符串速查表《Markdown速查表》《Python:Pip速查表》好在网上已经有不少 Python速查表(Python cheat sheet),虽然大部分都是英文版的,也不难理解。今天跟大家分享一份Python速查表,同时配套了长图和26页的pdf,我觉得还不错。这份Python速查表主要包括的内容如下:原创 2022-09-18 13:33:27 · 1007 阅读 · 0 评论 -
Python 最好用的8个VS Code扩展
很多时候,我们用到的代码片段都是类似的,比如for循环、try/catch等等,现在有了这个工具,我们只需要输入命令生成代码片段,然后再进行微调,就能完成功能的开发。此外,有些时候我们可能会忘记某些内置函数的用法,这个工具也能给你提供示例代码做参考,而不用你再去搜索引擎搜索示例,实在非常方便。经过一番查阅,我终于找到了能纠正VSCode缩进错误的扩展,它就是Python Indent,看看下面的示例,相信你也会安装它。而且还能将所有文本打乱顺序。原创 2022-09-18 13:29:10 · 216 阅读 · 0 评论 -
Python库大全,建议收藏留用!
学Python,想必大家都是从爬虫开始的吧。毕竟网上类似的资源很丰富,开源项目也非常多。Python学习网络爬虫主要分3个大的版块:抓取,分析,存储当我们在浏览器中输入一个url后回车,后台会发生什么?简单来说这段过程发生了以下四个步骤:查找域名对应的IP地址。向IP对应的服务器发送请求。服务器响应请求,发回网页内容。浏览器解析网页内容。?那么学习爬虫需要掌握哪些库呢urllib -网络库(stdlib)。requests -网络库。grab – 网络库(基于pycurl)。原创 2022-09-18 13:13:39 · 158 阅读 · 0 评论 -
如何建立一个完美的 Python 项目
当开始一个新的 Python 项目时,大家很容易一头扎进去就开始编码。其实花一点时间选择优秀的库,将为以后的开发节省大量时间,并带来更快乐的编码体验。在理想世界中,所有开发人员的关系是相互依赖和关联的(协作开发),代码要有完美的格式、没有低级的错误、并且测试覆盖了所有代码。另外,所有这些将在每次提交时都可以得到保证。(代码风格统一、类型检测、测试覆盖率高、自动检测)在本文中,我将介绍如何建立一个可以做到这些点的项目。原创 2022-09-16 15:40:56 · 3456 阅读 · 0 评论 -
Python自动化之定时任务
在日常工作中,我们常常会用到需要周期性执行的任务,一种方式是采用结合命令行实现。另外一种方式是直接使用Python。接下里整理的是常见的Python定时任务的实现方式。目录。原创 2022-09-16 15:34:47 · 497 阅读 · 0 评论 -
博采 27 门语言之长,提升 Python 的能力
拓宽我们的视野过程式编程:C、Rust、Cython面向对象的数据模型:Java、C#、Eiffel面向对象的 C 派生:C++、D面向数组的数据处理:MATLAB/Octave、Julia统计数据分析:R计算管道建模:Haskell、Scala、Clojure、F#事件驱动编程:JavaScript、Go、Erlang、Elixir渐变类型:TypeScript动态元编程:Hy、Ruby务实问题解决:Lua、PHP、Perl编程思维:Scratch、Logo作为世界上最流行的编程语言之一的共同设计者,我经原创 2022-09-16 15:29:06 · 1188 阅读 · 0 评论 -
Python并发方案深度对比
本文深度对比 Python 并发方案适用场景和优缺点,主要是介绍 asyncio 这个方案。注:本文代码需要使用 Python 3.10 及以上版本才能正常运行。原创 2022-09-16 15:25:21 · 450 阅读 · 0 评论 -
Python 轻量级 Web 框架:Bottle 库!
清华网为我们每一个网络接入点都提供了公网ip,在cmd中使用ipconfig查看ip地址,将run中的运行参数改为你的公网ip,然后在任何一台设备的浏览器上(建议手机,电脑浏览器有时候会很慢)输入ip地址和端口号(默认80),就可以访问啦!Bottle库还有很多强大的功能,Cookie的读写、插件的安装卸载与禁用都不在话下,也可以将Bottle部署到其他的服务器,非常简单的实现多线程,这些功能有待读者大大发掘哦!比如说网站服务器上存取文件,当然不能采取静态的方式,这时候我们就可以采用动态路由。原创 2022-09-16 15:15:33 · 147 阅读 · 0 评论 -
用 VSCode 写 Python,这 14 个插件不容错过!
可以说,Visual Studio Code 这个编辑器,让微软在开源社区赢回了王者段位,要知道全球 2400 万开发者中有 1400 万称 VSCode 为自己的家,再加上 GitHub 和 VSCode 的结合,几乎所有的程序员的都离不开 VSCode,不过,VSCode 如此优秀,值得每个程序员使用,甚至我觉得非程序员都可以用它来码字。如果你还没用过 VSCode,那访问这里安装[1]一个吧,很可能就打开了一个新世界。原创 2022-09-16 15:09:21 · 8423 阅读 · 0 评论 -
Python调用Prometheus监控数据并计算
时间序列数据(TimeSeries Data) : 按照时间顺序记录系统、设备状态变化的数据被称为时序数据。无人驾驶运行中记录的经度,纬度,速度,方向,旁边物体距离等。某一个地区的各车辆的行驶轨迹数据。传统证券行业实时交易数据。实时运维监控数据等。性能好、存储成本低Prometheus 是一个监控平台,它通过抓取监控目标(targets)上的指标 HTTP 端点来从这些目标收集指标。安装完Prometheus Server端之后,第一个targets就是它本身。具体可以参考官方文档。原创 2022-09-16 15:02:58 · 3725 阅读 · 0 评论 -
Python 笔记
Python 由 Guido van Rossum(荷兰 🇳🇱)开发。Python 是一门解释型语言、动态类型(弱类型)语言。Python 的名字来源于 Monty Python's Flying Circus。原创 2022-09-16 14:43:49 · 575 阅读 · 0 评论 -
python面试题37道(附答案)看完面试不愁了
多余的数据将缓冲于接收端。内存池的概念就是预先在内存中申请一定数量的,大小相等 的内存块留作备用,当有新的内存需求时,就先从内存池中分配内存给这个需求,不够了之后再申请新的内存。这个方法是在默认的浏览器中显示url, 如果new = 0, 那么url会在同一个浏览器窗口下打开,如果new = 1, 会打开一个新的窗口,如果new = 2, 会打开一个新的tab, 如果autoraise = true, 窗口会自动增长。在析构时,也采用了内存池机制,从内存池来的内存会被归还到内存池中,以避免频繁地释放动作。原创 2022-09-16 14:23:52 · 1482 阅读 · 0 评论 -
25道Python经典面试题大全,看这一篇就够了
Number属于不可变对象,这样实参的值传给形参的时候,会使用值传递,只会用实参的值来初始化形参的存储单元,也就是说实参和形参会是两个不同的存储单元,所以函数里面进行的赋值操作,不会改变函数外面变量的值。所有对象都是实例化或者调用类而得到的,python中一切都是对象,通过class关键字定义的类本质也是对象,对象又是通过调用类得到的,因此通过class关键字定义的类肯定也是调用了一个类得到的,这个类就是元类。是可以在类的所有实例之间共享的值(也就是说,它们不是单独分配给每个实例的)。原创 2022-09-16 14:13:27 · 3378 阅读 · 0 评论