![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
文章平均质量分 67
二哥不像程序员
公众号:数据山谷
展开
-
Python|解决Matplotlib中文及符号显示异常
对于中文显示要区分系统,win/mac系统的字体设置如下。原创 2023-08-30 15:53:36 · 427 阅读 · 0 评论 -
520|用Python绘制自定义照片墙
俗话说:做人苦,做男人更苦。俗话又说:世间节日千千万,一个不过就完蛋。520又到来了,今天交给大家一个绘制自定义照片墙的方法。一、准备物料照片若干Python+PIL库二、绘制思路制定照片墙背景制定背景的方式有很多种,简单点的我们可以用一张黑底白图的照片作为背景,在绘制的时候白色区域会被照片所填充,而黑色区域则会变成透明的状态。本文我们使用的方式为指定文字(数字、英文、中文都可以)做为背景,然后进行图片填充。核心思想在于将文字写成白色,将背景涂成黑色。进行图片填充.原创 2022-05-20 19:04:15 · 1540 阅读 · 1 评论 -
Python使用ffmpeg完美解决方案(避坑必看)
近期有个需要进行音频转码的小任务需要用到ffmpeg,安装和使用的过程中遇到了很多问题没有办法解决,从网上找了各种教程也是一言难近,本文二哥来梳理一下从0到1在Mac上使用ffmpeg。一、在系统中安装ffmpeg第一步需要在系统中安装ffmpeg,很多人都给出了使用brew命令进行下载的方案,在此说一下,多数人brew后都需要等n分钟,最后以报错告终,这种外部网站不稳定,因此强烈不推荐此方法。稳定的安装方法第一步:去官网下载安装包:ffmpeg官网第二步:选择自己的系统,点图片中的地方:.原创 2022-05-19 17:03:31 · 50238 阅读 · 9 评论 -
Python|Plotly数据可视化一网打尽(代码+应用场景)
Python数据可视化一网打进数据可视化作为数据分析最直接的结果呈现方式,了解其制作方式和应用场景是很有必要的,本文来了解一下各个图标的应用场景及代码实现。本文使用的代码主要基于做图库plotly如果使用中有不懂的内容,联系二哥!可以先收藏点赞,后面掏出来直接用!一、可视化绘制思维导图二、比较类图创建示例数据如下:import pandas as pddata = pd.DataFrame({ 'name': ['Bob', 'Mary', 'Peter', 'Ben'原创 2022-05-04 19:13:22 · 4509 阅读 · 6 评论 -
Python|获取文件夹下的指定类型文件名并存入表格
本文我们来通过简短的代码来实现一个快速文件夹内文件名遍历功能,并把制定类型的文件名存入到表格中。一、获取文件夹下的文件内容想要对电脑中的文件夹进行操作,我们首先需要做的就是使用Python中的os模块去遍历文件夹内容。方式如下:import os# out为路径os.walk('out')使用这种形式我们就能够得到该路径下所有文件的信息,但是这样简单的到的信息是一种迭代形式,我们需要循环遍历的到里面的信息。for root, dirs, files in os.walk('out'):.原创 2022-04-08 16:30:06 · 3454 阅读 · 0 评论 -
Python|用tkinter实现自定义记事本
Python中我们通常使用tkinter来进行UI界面的编写,本文我们来使用tkinter实现自定义记事本。一、思考想要完成记事本,我们首先需要考虑一个正常的记事本都需要具有哪些功能,我们将这些功能按键添加到我们的UI界面上即可。一般功能如下:新建文本文档打开本地文件保存文本文档功能项:剪切、复制、粘贴等设定好了基本的功能选项之后我们再来思考实现记事本的思路。创建记事本窗口设定记事本菜单项给不同的菜单项配置不同的功能选项运行笔记本二、代码实现创建记事本窗口创建窗口的时.原创 2022-03-29 18:56:18 · 3202 阅读 · 4 评论 -
RFM用户分层模型|原理+Python全流程实现
RFM 模型在数据分析中经常会进行用户分层,本文我们来了解一下常见的用户分层模型RFM。RFM概念RFM是由R(Recency)、F (Frequency)、 M(Monetary) 三个维度构成的,其具体含义如下:R:最近一次消费时间间隔F:消费频率M:消费金额这里对于这三个维度的概念简单的做一个说明:R:当前日期为3.25日,上一次消费日期3月20日,消费时间间隔为5天。F:一年内去某商场消费100次,消费频率为100次。M:一年内去某商场消费总额为1W元,消原创 2022-03-26 18:32:49 · 8636 阅读 · 3 评论 -
Python|详解Python中的axis参数
在我们使用Python中的Numpy和Pandas进行数据分析的时候,经常会遇到一个让人感到头痛的参数——axis,本文让我们换一个角度来重新认识一下axis。一、axis简介通常情况下我们都会赋予axis参数“轴”的概念,对于常见的二维数据来说,我们有如下的表示形式:对于这种常见的结构来说,看上去很清晰,但是涉及到实际操作的时候就会变的难以理解,下面让我们用色横货中的例子来学习一下。二、不一样的axis对于axis=0当axis=0的时候,我们可以将数据和轴组成的整体看作是一串竖着摆放的.原创 2021-12-20 16:45:19 · 8128 阅读 · 2 评论 -
中秋节快到了,别学Python了,进来排队领块月饼吧【纯手工哪种】!
一年一度的中秋节又要来了,作为程序员的我们当然要画“饼”充饥了。本文二哥带领大家用Python画几个月饼~❤️温馨提示:工作再忙,别忘了吃饼~❤️❤️提前祝大家中秋节快乐❤️一、准备Python3turtle模块勤劳的小手二、构思与绘图找一块传统月饼为例:绘制外表想要画月饼,第一个我们能想到的就是圆形的外表,但是月饼的圆通常比较特殊,每个位置会有一个凸起的弧度$%&%$…(不知道如何形容)总结一下就是像花一样的形状。代码如下代码中的循环用于绘制小的弧线,最终.原创 2021-09-15 15:21:18 · 2709 阅读 · 28 评论 -
❤️用Python开启摄像头截屏后回传到指定邮箱!❤️
今天二哥突发奇想,想看看每天忙碌着没时间理我的女朋友坐在电脑前在忙什么,于是二哥写了一个Python程序打包后发了过去…收到邮件中的图片效果如下图所示:老规矩!先点个赞吧…一、开启摄像头使用cv2(opencv)可以很轻松的达到开启摄像头的效果,开启摄像头的代码如下所示:import cv2# 参数0表示内置摄像头,1表示其他cap = cv2.VideoCapture(0)ret, frame = cap.read()# 开启摄像头cv2.imshow('cv window',.原创 2021-09-02 20:22:27 · 1541 阅读 · 11 评论 -
❤️MIT大神写给女神的Q版Python画图库—Cutecharts
MIT大神写给女神的Q版Python画图库—Cutecharts画图不好看?不可爱?不萌?本文二哥教大家来进行Q版绘图。【建议先点赞、再收藏】还记得那是一个月黑风高的晚上,一位女同事让我给他讲解数据分析结果的时候,我默默的用python画了下面这张图。依稀记得女同事看了之后,立刻转身离去,并留下了一句”哼,臭屌丝“,留下懵逼的我凌乱在风中。凌乱的我对这张图左看、右看、上看、下看,终于明白在不懂技术的妹子眼中,这种正经的图表简直就是屌丝的象征。为了避免下一次同样的事情发生,我翻遍了Python原创 2021-08-25 18:38:49 · 1254 阅读 · 3 评论 -
❤️马上七夕,不懂浪漫?带你用Python“码”上七夕【建议收藏】❤️
一年一度的七夕就要到来了,身边的人总是问我:送什么?二哥这么穷,这么不懂得浪漫的人送点什么呢!冥思苦想之后作为程序猿的我们总是要搞出来一点属于我们自己的浪漫,今天二哥就带着大家用Python“码”上七夕。PS:七夕当然是要送一个专属的礼物,本文的所有成果都可以定义,建议收藏!❤️静态照片二维码首先来一个简单点的静态照片二维码制作,用着她/他/它的照片,设置好你想说的话,生成照片就可以了。这里我们可以配置多种参数来调整二维码的规格,下同。words:二维码内容,链接或者句子(暂不支持中文)v.原创 2021-08-11 16:56:42 · 19236 阅读 · 105 评论 -
Python连接Hive数据库
import pyhivefrom pyhive import hiveimport pandas as pdimport key_oneclass LinkHive(object): def __init__(self,host,port,username,password,database): self.host = host self.port = port self.username = username self.p原创 2021-07-31 23:09:09 · 5878 阅读 · 4 评论 -
Python文件读写中的四大操作
本文二哥给大家带来文件读写中的四大操作的介绍,喜欢记得点赞、评论、收藏哟~一、读文件原创 2021-06-20 23:05:40 · 918 阅读 · 5 评论 -
Python数据加密方法详解|为你的隐私再上一把锁!
前言数字化时代下,数据安全是各大公司及个人最关心的一点,作为一个Python语言使用者我们该如何进行数据的加密呢?ben原创 2021-06-16 12:03:34 · 4477 阅读 · 39 评论 -
真香!端午节到来,我用Python画了几个粽子送给女票,女票差点吃了我的电脑...
引言小伙伴们好,我是二哥(二师兄),端午节就要到了,二哥突发奇想,用Python画了几个粽子送给女友,没想到她差点把我的电脑吃了.....原创 2021-06-11 15:21:05 · 3425 阅读 · 50 评论 -
5年Python生涯总结出10个玩Python必备的网站
系列文章目录提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加例如:第一章 Python 机器学习入门之pandas的使用提示:写完文章后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录系列文章目录 前言 一、pandas是什么? 二、使用步骤 1.引入库 2.读入数据 总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习..原创 2021-06-06 15:48:56 · 3695 阅读 · 68 评论 -
知道我淋雨之后,刚学会Python的学妹深夜写了个天气查询系统发给我.....
背景某天下班淋雨成了落汤鸡,发了个朋友圈感慨一下啊,然后......夜深人静之时,突然收到了来自女同事的Py文件,一运行发现事情并不简单(如下图):原创 2021-06-06 14:49:55 · 4085 阅读 · 74 评论 -
用Python30秒自动获取指定关键词的国际论文?思路清奇的我是这样做的......
背景又到了一年一度的毕业季,各路的同学们都在为了参考论文而发愁,本文我们通过Python来获取指定关键词的论文。思路本文的目的原创 2021-05-30 21:19:45 · 1740 阅读 · 38 评论 -
震惊!为了欣赏后宫的3000佳丽,我竟然用Python做出了一面墙?
背景每个人的手机中都存着很多美美的图片,每次发朋友圈的时候不知道怎么选择,怎么办?小孩子才做选择题,把照片做成一面墙!我全都要!原创 2021-05-28 17:16:55 · 4021 阅读 · 90 评论 -
完美解决nltk中nltk_data相关文件不能使用的问题
梳理nltk不能正常使用的解决办法MAC和WIN通用在使用Python中NLTK库的时候,总是会出现如下的问题(每个人的路径显示不同):这是报错信息提供的搜索位置信息,我们要做的就是去下载一个nltk_data放到相应的位置。国内高速下载传送门:nltk_data下载下载并解压后放到上述显示的任意搜索路径下,尝试使用nltk,测试代码如下:import nltknltk.word_tokenize("A pivot is the pin or the central poin原创 2021-01-15 15:18:45 · 2609 阅读 · 4 评论 -
Python|初识爬虫
HTML代码的获取在一般的数据爬取中,HTML代码是很重要的一部分,获取到了网页的HTML代码,我们就能够从中提取出我们所需要的数据,我们先来通过一段简单的代码来看一下如何获取HTML代码:from urllib.request import urlopenhtml = urlopen("在此输入想要获取的网页地址")print(html.read())获取代码的时候我们使用了一个Python标准库urllib,这个库不仅可以从网络请求数据,处理 cookie,还可以改变像请求头和用户代理这些元原创 2020-12-13 15:29:48 · 1999 阅读 · 1 评论 -
Python|用matplotlib画太极图
Python画太极 从古代的“三百六十行,行行出状元”到现如今的三万六千行,各行各业都有自己供奉的祖师爷,“天下百工圣人作”说的就是如此。比如,卖鞋的拜刘备,搞木工的拜鲁班,当老师的拜孔子,跑江湖的拜关二爷。那数据分析师拜谁呀? 龟叔? 贝叶斯? …….. 哪能啊。数据分析师的拜的是周易。 谁?周易。怎么能是他呢? ...原创 2020-12-01 16:24:35 · 2091 阅读 · 1 评论 -
MIT大神写给女神的Q版Python画图库—Cutecharts
Cutecharts还记得那是一个月黑风高的晚上,一位女同事让我给他讲解数据分析结果的时候,我默默的用python画了下面这张图。依稀记得女同事看了之后,立刻转身离去,并留下了一句”哼,臭屌丝“,留下懵逼的我凌乱在风中。凌乱的我对这张图左看、右看、上看、下看,终于明白在不懂技术的妹子眼中,这种正经的图表简直就是屌丝的象征。为了避免下一次同样的事情发生,我翻遍了Python的可视化库,终于找到了一个能够征服妹子的可视化库——cutecharts。cutecharts是由麻省理工学院的大神们改写的一款原创 2020-09-25 17:27:31 · 1250 阅读 · 0 评论 -
Python秒开100G数据是怎么办到的?
Python秒开100G数据是怎么办到的?在这个数据爆炸的时代,我们通常要对海量的数据进行分析,少则几十G,多则上百G,对于这样的数据我们打开都很困难,又该如何分析呢?通常都会采取下面几个方案:对数据抽样;使用分布式计算;使用强大的服务器。本文让我们来了解一个低成本又速度快的方法,使用一个强大的Python库-vaex来实现海量数据的读取和操作。Vaex是一个开源的DataFrame库,它可以对表格数据集进行可视化、探索、分析,甚至机器学习,这些数据集和你的硬盘驱动器一样大。它可以在一个n原创 2020-07-17 16:32:23 · 3032 阅读 · 1 评论 -
Python|一行代码获取股票数据
随着金融行业的发展,金融相关的数据变得越来越有价值。股票的历史数据就是一种非常重要的时间序列数据,本文介绍一个不需要自己动手写爬虫就能够获取各个公司的股票信息的Python库——yfinance。yfinance的安装yfinance作为一种数据分析中常用的数据获取库,自然需要一些前置库的安装,其前置库和本身的安装代码如下:pip install numpypip install pandaspip install requestspip install yfinanceyfinance的使原创 2020-06-28 19:31:46 · 7190 阅读 · 1 评论 -
用Python走迷宫|Q-Learning|强化学习
Q-Learning走迷宫上文中我们了解了Q-Learning算法的思想,基于这种思想我们可以实现很多有趣的功能和小demo,本文让我们通过Q-Learning算法来实现用计算机来走迷宫。原理简述我们先从一个比较高端的例子说起,AlphaGo大家都听说过,其实在AlphaGo的训练过程中就使用了Q-Learning的思想,对于机器下错棋和下对棋的时候给予一定的惩罚和奖励,当经过无数次的训练之后,机器自然就会直接向着奖励前进,直接选择对的位置进行下棋,久而久之在各种场景下都能选择对的位置下棋的机器人就能原创 2020-06-16 15:31:08 · 6383 阅读 · 9 评论 -
Python|Pandas的常见操作
为什么要用PandasPandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。pandas的主要特点基于Numpy创建,继承了Numpy中优秀的特点;能够直接读取结构化数据进行操作;以类似于表格的形式呈现数据,便于观察;提供了大量的数理统计方法。Pandas的两种数据结构Series:带标签的一维同构数组;DataFrame:带标签的,大小可变的,二维异构表格。按照层级关系来说的话,可以说D原创 2020-05-13 15:03:02 · 1395 阅读 · 0 评论 -
Python|NumPy的常用操作
为什么要用NumpyPython中常用的基本数据结构有很多,通常我们在进行简单的数值存储的时候都会使用list来进行,但是list的缺点在于对于每一个元素都需要有指针和对象,对于数值运算来说,list显然是比较浪费内存和CPU计算时间的。为了弥补这种结构的不足,Numpy诞生了,在Numpy中提供了两种基本的对象:ndarray和ufunc。ndarray是存储单一数据类型的多维数组,ufunc则是能够对数组进行处理的函数。Numpy的主要特点具有运算快,节约空间的ndarray,提供数组化的算数运原创 2020-05-08 20:33:52 · 1371 阅读 · 2 评论 -
Python pyttsx3|文本朗读(各种语言)
Python文字转语音程序员,在其他人眼中往往都是高冷的存在,在他们的眼中能用代码解决的问题绝对不考虑其他的方法,本文让我们用Python来提升一下高冷的档次,让我们用代码来“说话”。安装pyttsx3安装下面就让我们来看一下Python是怎样开口“说话“的。我们先安装需要的库pyttsx3:pip install pyttsx3语音引擎工厂类似于设计模式中的“工...原创 2020-04-29 19:39:14 · 23209 阅读 · 17 评论 -
Jupyter中显示DataFrame的全部行和列
如果想要指定最大的行数和列数,代码如下:pd.set_option('max_rows', 5)pd.set_option('max_columns', 5)如果想要直接指定显示所有的行和列,代码如下:pd.options.display.max_columns = Nonepd.options.display.max_rows = None...原创 2020-04-09 11:11:14 · 16558 阅读 · 1 评论 -
Python|200行代码实现疫情地图
注:文末有完整代码及词库获取地址在我们每天关注着疫情变化的同时,可以看到各式各样的疫情地图,本文就让我们一起来实现一下疫情地图的制作。文中的代码均由python实现,需要准备的库如下:1.bs42.pyechart(V1,博主版本1.7.1)3.pandas库的引入import refrom bs4 import BeautifulSoupfrom urllib....原创 2020-04-01 14:53:55 · 5200 阅读 · 14 评论 -
小工具|Python进度条模块Progressbar
Python进度条模块Progressbar今天突然被问了一个问题:程序在执行中很久不结束是怎么回事?看不到程序执行的进度,在我们进行大工程的时候的确是一件很头疼的事,本文让我们来了解一个很常用的进度条展示小工具——Progressbar。注:最新版的使用者不要照着GitHub上的官方文档去操作,文档信息没有维护,会出现很多问题。下载模块pip install progressb...原创 2020-03-07 16:20:54 · 3063 阅读 · 1 评论 -
2020了,你还不会用seaborn?
Seaborn提到python画图,我们第一个想到的库一定是matplotlib,但是随着大家眼光的提高,matplotlib画出的图渐渐“失宠”了,今天就让我们来了解一下建立在matplotlib上的绘图库——seaborn。先来看一下对于seaborn的官方说明:- 面向数据集的API,用于检查多个变量之间的关系;- 专门支持使用分类变量显示观察结果或汇总统计信息;- ...原创 2020-03-06 16:12:56 · 2182 阅读 · 0 评论 -
一文学会用python进行数据预处理
目录数据预处理1、概述2、缺失值处理查找缺失值缺失值处理方法3、异常值处理异常值的识别异常值处理的常用方法4、数据集成5、数据变换数据转换数据标准化最大-最小规范化规范化特征二值化6、数据规约维灾难维规约数据预处理1、概述实际的数据库极易受到噪声、缺失值和不一致数据的侵扰,因为数据库太大,并且多半来自多个异种数据源...原创 2019-09-18 17:53:09 · 1683 阅读 · 0 评论 -
基础爬虫框架及运行(选自范传辉Python爬虫开发与项目实战)
基础爬虫框架的五个模块有一:URL管理器URL管理器主要包括两个变量,一个是已爬取URL的集合,另一个是未爬取URL的集合。采用Python中的set类型,主要是使用set的去重复功能,防止链接重复爬取,因为爬取链接重复时容易造成死循环。链接去重复在Python爬虫开发中必备的功能,解决方案主要有3种:①内存去重②关系数据库去重③缓存数据库去重。大型成熟的爬虫基本上采用缓存转载 2017-11-16 13:36:12 · 1131 阅读 · 0 评论 -
Python3 数据结构与算法之冒泡排序
冒泡排序冒泡排序的时间复杂度问题最优时间复杂度:O(n) (表示遍历一次发现没有任何可以交换的元素,排序结束。)最坏时间复杂度:O(n2)稳定性:稳定冒泡排序的基本思想比较相邻的元素。如果第一个比第二个大(升序),就交换他们两个。对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对。这步做完后,最后的元素会是最大的数。针对所有的元素重复以上的步骤,除了最后原创 2017-12-10 15:23:02 · 326 阅读 · 1 评论 -
Python3 数据结构与算法之选择排序
选择排序基本思想:选择排序是一种简单直观的排序算法。它的工作原理首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然后,再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。以此类推,直到所有元素均排序完毕。选择排序的时间复杂度问题最优时间复杂度:O(n2)最坏时间复杂度:O(n2)稳定性:不稳定(考虑升序每次选择最大的情况)对考虑升序原创 2017-12-19 17:30:16 · 611 阅读 · 0 评论 -
Python3 数据结构与算法之插入排序
插入排序基本思想:插入排序是一种简单直观的排序算法。它的工作原理是通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入。插入排序在实现上,在从后向前扫描过程中,需要反复把已排序元素逐步向后挪位,为最新元素提供插入空间。插入排序的时间复杂度问题最优时间复杂度:O(n) (升序排列,序列已经处于升序状态)最坏时间复杂度:O(n2)稳定性:原创 2017-12-27 13:27:03 · 412 阅读 · 0 评论 -
Python3 数据结构与算法之希尔排序
希尔排序基本思想:希尔排序(Shell Sort)是插入排序的一种。也称缩小增量排序,是直接插入排序算法的一种更高效的改进版本。希尔排序是非稳定排序算法。该方法因DL.Shell于1959年提出而得名。 希尔排序是把记录按下标的一定增量分组,对每组使用直接插入排序算法排序;随着增量逐渐减少,每组包含的关键词越来越多,当增量减至1时,整个文件恰被分成一组,算法便终止。希尔排序的过原创 2018-01-23 18:34:54 · 619 阅读 · 0 评论