自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(285)
  • 收藏
  • 关注

原创 小伙子不讲武德,竟用Python爬取了B站上1.4w条马老师视频数据来分析

看到标题,啪的一下你就进来了吧!如果有经常刷B站的小伙伴,肯定都知道B站鬼畜现在的顶流是谁?印度:没错正是在下那必须是当代大师浑元形意太极拳掌门人「马保国」先生啊!实话讲,马保国走进大家...

2020-11-18 20:01:53 68841 292

原创 Python 爬取 201865 条《隐秘的角落》弹幕数据,发现看剧不如爬山?

Python 爬取 201865 条《隐秘的角落》弹幕数据,发现看剧不如爬山?本文不涉及剧透!请放心食用最近又火了一步国产剧:《隐秘的角落》如果你没看过,那可能会对朋友圈里大家说的“一起去爬山”、“小白船”、“还有机会吗”感到莫名其妙。小五在这个端午假期也赶紧刷完了本剧,必须要写篇文章了,由于《隐秘的角落》是在爱奇艺独播,所以数据从爱奇艺下手最直接。如果没爬过爱奇艺,可以考虑使用豆瓣、微博、知乎(电视剧数据分析 · 万能三件套)的数据。爬虫剧很精彩,但追剧界有句俗话说得好:“弹幕往往比剧更

2020-06-29 22:52:22 4629 15

原创 用python爬取3万多条评论,看韩国人如何评价韩国电影《寄生虫》?

大家好,我是朱小五今天给大家带来一个关于电影的数据分析文章。别走啊,这次不是豆瓣,也不是猫眼真的今天分析的电影是韩国电影《寄生虫》。它是由韩国导演奉俊昊自编自导的影片,一举拿下最佳影片、最佳导演、最佳原创剧本和最佳国际电影四座奥斯卡奖杯,创造历史成为奥斯卡史上首部非英语最佳影片。nb plus!这次带大家看看韩国人如何评价这部韩国电影的?获取数据数据从哪获...

2020-03-03 15:51:03 18404 25

转载 matplotlib绘图技巧详解(三)

↑关注 + 星标~有趣的不像个技术号每晚九点,我们准时相约大家好,我是黄同学我们之前已经讲述了matplotlib的绘图原理,陆续会更新绘图技巧、相关图形绘制。《matplot...

2020-02-26 21:00:00 3218 1

原创 理财一年,亏了30%

大家好,新的一年又开始了,今天大A终于又重回了3000点!回顾去年的国内投资市场,没想到真的如招财大牛猫的段子所说的一样:“怎么能让股民在2900点也能开开心心过年,方法是先干到2700,然后再拉回2900,原先还骂骂咧咧的股民一定会感激涕零的过大年。[1]”这篇文章,我将以一位朋友的亲身经历为切入点,结合市场数据和投资者的故事,探讨普通人投资...

2024-02-23 20:00:16 785

原创 ChatGPT会代替数据分析师吗?

大家好,我是朱小五。最近一个多月以来,ChatGPT已经成为了“家喻户晓”的一个词。3月15日,OpenAI 开发布会宣布GPT-4,紧接着百度发布了自己AI产品文心一言。3月23日,OpenAI 宣布推出插件功能,赋予 ChatGPT 使用工具、联网、运行计算的能力。接下来的一个月,各种或基于ChatGPT或自研的AI产品纷纷落地测试。很多行业大佬惊呼,所有数字化系统和各个行业都值得用ChatG...

2023-05-05 20:04:28 2530 1

原创 最近搭了一个数据监测看板。

在大数据时代(这个开头我已经看腻了 ),为了挖掘冗余数据的价值,数据分析需求日益增多,而分析结果的常见表现形式有数据分析报告和数据看板(大屏),与报告文档不同,数据看板是对动态可视化的高度凝练,具有实时性强、信息量大的特点,又因其酷炫的视觉效果,深受数据产品需求方的青睐。构建数据看板的工具有很多,比如 Python 生态的 pyecharts、plotly,或者 BI 软件的 FineBI、Pow...

2023-04-11 22:33:54 787

原创 王炸!ChatGPT这算是彻底打脸马云。。。

在2019年的世界人工智能大会上,马斯克和马云针对人工智能话题上演了一场精彩对话。马云:我不觉得AI是一种威胁,我不认为人工智能是很恐怖的东西,因为人类很聪明。马斯克:一般大家都会低估人工智能的能力,实际上,机器很有可能比人聪明得多。从马云的角度来看,人工智能确实是人类自己发明的技术,我们对它有着很高的控制力和决策权。正如他所说,人类具有强大的智慧和创造力,我们可以通过合理的应用人工智能来解决很多...

2023-03-31 22:58:42 7369 1

原创 5个代码技巧,加速你的Python

人生苦短,快学Python!Python作为一种功能强大的编程语言,因其简单易学而受到很多初学者的青睐。它的应用领域又非常广泛:科学计算、游戏开发、爬虫、人工智能、自动化办公、Web应用开发等等。而在数据科学领域中,Python 是使用最广泛的编程语言,并且其受欢迎程度持续增长。如果也经常需要用Python处理海量数据,就一定会遇到代码运行几十分钟甚至更久的情况。今天我们会给大家分享7个代码技巧,加速你的Python运行速度,提高Python技能!

2023-03-19 17:24:35 1125

原创 来 CSDN 三年,我写了一本Python书

大家好,我是朱小五。转眼间已经来 CSDN 3年了,其中给大家一共分享了252篇Python文章。但这三年,最大的收获还是写了一本Python书!在这个自动化时代,我们有很多重复无聊的工作要做。想想这些你不再需要一次又一次地做的无聊的事情,让它自动化,让你的生活更轻松。所以我们才会选择学习Python,学习Python自动化办公,学习Python操作Excel × Word × PPT等等。。。我和另一位CSDN博客专家【】,开始了两年的写书历程!

2023-03-03 11:41:33 786 1

原创 用 Python 画如此漂亮的插图 ,So easy

人生苦短,快学Python!今天我们进行一次实战案例分享,以全球预期寿命与人均 GPD数据为例,写一篇 Python 中漂亮散点图的快速指南。除了正常的数据清洗/处理、还会进行简单的统计分析,实现数据处理-统计分析-可视化一条龙。你会发现,用 Python 画如此漂亮的专业插图 ,So easy!

2023-02-26 01:04:59 999

原创 印度这事真的干的挺棒的! |

来源:statista最近逛外网看到一张图,是关于印度家庭自来水供应的对比图。Crore是印度的单位千万(卢比),所以他们从2019年供应3.23千万家庭,增长到了2022年的9.57万家庭,印度这事真的干的挺棒的!一直以来印度的自来水/电力覆盖率都是自媒体用来对比中印的重要指标,目前看来印度政府也是干“人事儿”的,也正在逐步解决各种民生问题。实际上这是印度第二次尝试发展农村自来水基础设施,第一次...

2023-02-25 13:00:27 659

原创 用Python出了3000道数学题,外甥表示要正月剪头

人生苦短,快学Python!过年期间发现小外甥已经上小学了,我姐说老师今天给他们布置了寒假作业:每天坚持做乘法和加减法混合运算。这我必须帮帮忙,用Python写了一段自动生成小学生计算题的代码,并支持导出到Word中直接打印出来就能给小外甥写了。

2023-02-08 20:12:30 524

原创 2022年我国出生率预测,恐怕。。。

大家好,我是朱小五。去年1月份国家统计局公布数据:显示2021年出生人口为1062万,创下了近年来新低,比2016年下降了43.6%,2021年净增长人口为48万人。转眼又一年了,2022年我国出生率会是什么样呢?如何预测出生率?坊间一直有个比较“邪乎”的说法,可以通过每年卡介苗批签发量能否推算出生人口?如果你说卡介苗批签发量与每年的出生人口正相关,这是可信的的,但如果想直接推算比例恐怕有些困难。...

2023-01-10 21:49:45 5870

原创 我国南北居民收入差距 正在扩大。

先说一个结论,我国南北居民收入差距正在扩大。改革开放以来,大家一直讨论的是东部西部的经济发展差距,这也成为了后续西部开发的国策的影响因素。但近10-20年来,有了更多的变化。东北和西北地区多个省份面临经济增长动力不足、速度不快、投资下滑、人口流失等问题,导致整个北方地区的发展势头都减弱,于是,南北差距逐渐浮上了水面。不过需要先强调一下分界,上过地理课的小伙伴们都知道,秦岭淮河分界线是中国北方地区和...

2022-11-12 22:21:25 510

转载 零基础学习xlwings,看这篇文章就够了

在日常生活中我们或多或少的都会跟Excel打交道,比如做销售统计,人力的考勤,学生的考试成绩等等,甚至在某些领域会涉及到批量操作Excel表格,那对于非程序员来说,可能使用Excel中的函数,但是在某种场景下这些又是不好使的,只能熬夜加班啦!app.display_alerts:在使用Excel的过程中,经常会遇到一些提醒信息,比如关闭前的保存提示、数据有效性的警告窗口,若想隐藏这些窗口可以设置成False。在操作区域或者单元格之前,首先就要引用他们,其实就是表明你要操作的区域或者单元格是哪些。

2022-11-05 13:20:26 3002

原创 Python转换图像格式,超全

人生苦短,快学Python!最近我遇到了Python转换图像格式问题,正好干脆总结了一波,将一些奇怪的图片格式(webp格式、jfif格式、svg格式)转换为常见的jpg、png图片格式。

2022-10-31 12:05:36 2869

原创 用Python剪辑视频?太简单了

人生苦短,快学Python!最近我在网上下载一个视频,结果下载到本地是近百个视频片段,为了方便观看只能将这些片段合并为一个视频整体。不过我并没有搜到能够处理类似情况的小工具,只是发现剪映等软件可以实现视频合并功能。但是为此下载一个视频剪辑软件,再将一百个视频导进去,最后重新渲染视频也要花费不少时间。那我,还不如干脆写个Python小脚本,让程序自己慢慢跑去。

2022-10-29 20:55:01 8520 1

原创 反转Python列表的4种方法

列表是 Python 中基本且最常用的数据结构之一,它是一个可变且有序的对象集合,也可以存储重复值。有时候我们需要将列表元素进行逆序排列,也就是所有的元素位置反转。今天就跟大家聊聊反转Python列表的4种方法。

2022-10-19 22:15:01 3515

原创 用Python爬虫的request方式实现自动签到

之前我曾经写过一个系列的文章,介绍自己如何使用Python解决了各种各样的日常需求。在这其中有一篇文章《》,就是以我亲身的经历来讲解如何实现某网站的定时签到。不瞒大家说,这个方法非常实用,一年前的代码至今仍然可以正常使用。但我今年年初时候买了个服务器,就寻思将这些本地电脑的定时任务都迁移到服务器上。这个时候再去回看之前的代码,使用Selenium作为我们的自动签到解决方案就显得有些“笨重”了。我今天呢,要给大家分享一下升级款——request方式。

2022-09-20 14:15:23 4275 3

原创 Python实战-乱序文件重新命名编号

最近我遇到了一个小问题,感觉也会有其他同学会遇到,所以干脆分享出来。如下图所示,在本地文件夹中有这样一堆视频文件,在这种情况下并不是乱序的。但是将其上传到网盘中后,就会经常变成乱序。即它们会按照1、10、11、2、20这样排序,并不方便我们按顺序去依次观看。所以我们希望能够给它们在本地重新命名编号,比如可以按照001、002、003···、020这样排序,就可以避免上面这种尴尬的情况了。

2022-09-14 14:33:30 932

原创 要被抖音笑死了,打开个网页就算黑客?

大家在刷抖音的时候都会看到类似的视频:营销号用txt记事本巴拉巴拉写几行代码,就可以伪装成黑客了。▲一顿操作猛如虎又比如下面这样,远看一顿操作猛如虎,近看代码原来是打开网页。▲打开某个网页简单看了几个视频,发现“黑客”营销号们最常用的套路就是 dir/s start和exit do和loop。其中DOS命令start这个命令,它可以启动一个exe程序,也可以启动一个BAT批处理脚本。

2022-09-08 02:49:01 43446 41

原创 大数据扫黄,是真的吗?

在当前的大数据时代背景下,每个人的大量社会活动都会被大数据系统记录下来。最近跟小伙伴聊起一件事:大数据扫黄,结果发现大家格外感兴趣。而我平时呢,也会看【守护解放西】、【孝警阿特】之类的视频,发现相关视频的播放量也特别高,那么今天就来探讨一下:大数据扫黄,是真的吗?▲【孝警阿特】视频截图1先一个很久之前的说法,看起来就非常假的很,很难不怀疑是大数...

2022-08-23 22:25:26 5184 3

原创 用Python爬取手机壁纸,太简单了吧

我们只需访问接口,再解析json数据,即可获取精准的壁纸图片url。其中我们需要先利用Python中的request库和正则构建获取函数,以此爬取页面中的图片url。最近我花了两年写的新书已经上市,也算是我在CSDN博客分享Python知识3年的一个总结!小米壁纸是什么,其实就是小米手机系统自带的app,包含了各种风格的手机壁纸。如果你使用浏览器打开该链接,就能得到10张壁纸图片的详细数据。剩下的只需调用Python下载图片到本地即可,具体代码如下所示。的文件夹,会发现所有的图片都已经被下载到本地。

2022-08-22 17:37:51 768

原创 Python也可以实现Excel中的“Vlookup”函数

Python实现VLOOKUP函数大家应该都很熟悉吧,它可以帮我们根据指定的条件快速查找匹配出相应的结果,通常被用于核对、匹配多个表格之间的数据。与数据透视表,并称为数据er最常用的两大Excel功能。那我们今天就聊聊,如何Python写Excel中的“Vlookup”函数?...

2022-08-09 16:32:17 2786

原创 别再问我如何制作甘特图了!

大家好,我是朱小五。甘特图,又称横道图或条状图,是美国科学管理学派创始人亨利·甘特在20世纪初,设计的一种组织和监控项目进度的工具。在工作上,我们可以将其用作在产品开发管理、项目管理等;在生活中,我们可以使用甘特图来标注自己的月度计划、个人提升规划等等。用来制作甘特图的专业工具也不少,常见的有:Microsoft Office Project、GanttProject、W...

2022-07-27 20:00:12 1769

转载 Python操作Excel、Word、PPT、PDF、复杂文件、通信软件(微信、邮件、飞书、钉钉)、图片集合大全

很多朋友为了学习如何用Python自动化地处理各种文档,应该都下载过这个文档:python操作excel、word、pdf.pdf。时至今日,仅仅在CSDN一个渠道的下载量便超过了3W+!这个文档也算国内第一个真正意义上的Python自动化文档。无论是从内容上,还是从排版上,都受到了大家的一致好评!也因此有读者建议,是否可以将此类相关内容整理成知识体系完整、内容翔实的书!于是,我就开始了两年的写书历程!并针对图书内容进行了反反复复的沟通,还征求了许多读者朋友们的意见,最终将全网累计阅读量超2000000的原

2022-07-11 20:55:50 3835 3

原创 Python自动化办公 | 用Python自动生成数据日报

Python自动化办公 ,用Python自动生成数据日报!用Python批量生成数据报告!

2022-07-09 19:35:22 2944 44

原创 Python比较两个日期的多种方法

之前我们曾经分享过:Python获取某一日期是“星期几”的6种方法!实际上,在我们使用Python处理日期/时间的时候,经常会遇到各种各样的问题。今天我们就来探讨另一个问题,如何用Python比较两个日期?如果需要用Python处理日期和时间,大家第一时间肯定会想到datetime、time、calendar等模块。在这其中,datetime(日期时间)模块主要是用来表示日期的,就是我们常说的年月日/时分秒。d...

2022-07-03 03:20:19 11739 1

原创 Python识别二维码的两种方法

人生苦短,快学Python!大家好,我是朱小五最近在搜寻资料时,发现了一则10年前的新闻:二维码将成线上线下关键入口。从今天的移动互联网来看,支付收款码/健康码等等与我们息息相关,二维码确实成为了我们生活中不可或缺的一部分。在学习Python处理二维码的过程中,我们看到的大多是“用python生成酷炫二维码”、“用Python制作动图二维码”之类的文章。而关于使用Python批量识别二维码的教程,并不多见。所以今天我会给大家分享两种批量识别二维码的Python技巧!二维码又称二维条码,常见的二维码为QR C

2022-06-29 16:22:58 13859 1

原创 Python中查询缺失值的4种方法

在我们日常接触到的Python中,狭义的缺失值一般指DataFrame中的。广义的话,可以分为三种。今天聊聊Python中查询缺失值的4种方法。在Pandas中查询缺失值,最常用的⽅法就是,返回True表示此处为缺失值。我们可以将其与⽅法搭配使用来查询存在缺失值的行,也可以与⽅法搭配使用来查询存在缺失值的列。在交互式环境中输入如下命令:输出:在交互式环境中输入如下命令:输出:在交互式环境中输入如下命令:输出:由于在Pandas中方法返回True表示此处为缺失值,所以我们可以...

2022-06-13 23:46:28 10614 2

原创 搭建了一个可视化大屏。

大家好,我是朱小五如果制作数据可视化大屏,我感觉已经分享过超多次了,真的是“万物”皆可制作数据看板。从Excel、到Python中的pyecharts、Streamlit,再到镝数图表,甚至为了实现更加的动态交互我还学习了web开发。不过在实际工作中,用BI工具搭建数据看板才是最常用的方式。在国内大家使用最多的BI工具应该就是:Tableau、Power BI、帆软、或者...

2022-06-09 22:18:13 1559

原创 最近常用的几个数分模型。

现在的618活动越来越提前,从最早的618当日抢购,再到6月份开始便是618的预售,最后到今年520就开始了618活动。我发现甚至还分为了预售期、专场期、高潮期和续售期。而对于电商平台来说,就需要在更提早制定营销方案,在现有预算的情况下实现用户的精准营销。而针对用户精细化运营、精准化营销最离不开的就是用户分群。所谓用户分群,就是我们以具备某几种特征的用户(who)在某段时...

2022-06-08 21:57:17 656

原创 Python实战:将头像变成动漫风

将头像转化为动漫风,就是希望在保持原图像信息和纹理细节的同时,将真实照片转换为动漫/卡通风格的非真实感图像。目前除了百度api,Github上还有不少开源库可供我们直接使用。其中AnimeGAN是来自武汉大学和湖北工业大学的一项研究,采用的是神经风格迁移 + 生成对抗网络(GAN)的组合,实现效果非常符合我们的需求。...

2022-06-08 15:54:31 8648 7

原创 Python中堪称神仙的6个函数

注:本文作者朱小五,原文首发于公众号【快学Python】,站内同一标题那篇文章是抄袭,最恶劣的是直接复制还抹去我的水印人生苦短,快学Python!大家好,我是小五。之前给大家分享过3个节省时间的Python技巧,当时就提出了,大家可以多使用Python的内置函数,既能提高自己的Python程序速度,同时还能保持代码简洁易懂。今天,它们就来了,我们会一次性分享6个堪称神仙的内置函数。在很多计算机书籍中,它们也通常作为高阶函数来介绍。而我自己在日常工作中,经常使用它们来使代码更快,更易于理解。La.

2022-05-29 12:47:44 665

原创 通过数据:提升用户转化与留存全攻略

如何想要产品收益最大化?就应该这样做——提升用户转化与留存全攻略首先我们看一下提升用户转化的运营价值。如图1所示,先引入两个概念——用户生命周期与用户价值(LTV)。如果将用户在一款产品中的行为轨迹当成一个生命周期,那么从最初用户了解、知晓产品开始,整个周期中将经历五个阶段,每个阶段用户为产品所能创造的价值是不同的。而用户价值(Life Time Value,LTV)指的...

2022-05-24 23:20:43 1081

原创 图解Pandas:查询、处理数据缺失值的6种方法!

大家好,我是小五。 上周我码了几篇文章,其中一篇是《花了一周,我总结了120个数据指标与术语。》。另外我还写了两篇Pandas的基础操作文,发在了「快学Python」上,如果还没看过的同学正好可以再看一下。在Pandas数据预处理中,缺失值肯定是避不开的。但实际上缺失值的表现形式也并不唯一,我将其分为...

2022-05-09 23:02:41 4103

原创 最近面试太难了。

在面试数据分析师时,往往会考察一下SQL的掌握程度。最近有位同学面试了几家,分享了一些觉得有些难度的SQL面试题:比如会让你用SQL实现行转列和列转行操作、用SQL计算留存、用SQL计算中位数、还有如何统计用户最大连续登录天数?当然这种题变形也很多,连续打卡天数、连续学习天数,连续点击天数等等都是同一个类型,今天我们将会给大家分享SQL和Pandas的多种做法。让大家一次...

2022-05-08 22:24:49 2604

原创 花了一周,我总结了120个数据指标与术语。

大家好,我是小五。数据分析总是离不开各种指标和术语,最近我花了一周整理了共120个数据分析指标与术语:用户数据指标、行为数据指标、业务数据指标、数据分析术语、统计学常用语、数据报告常用术语。文章较长,建议大家先点击本文右上角收藏保存。用户数据指标IP、UV、PV、VVIP(Internet Protocol):独立IP数。UV(Unique Visitor):独立访问客数...

2022-05-06 23:18:23 1355

原创 Python还能把“长的”变成“短的”?

人生苦短,快学Python!大家好,我是小五。最近我遇到了一些问题:需要将几百条长链接转成短链接。经过一番学习,发现Python可以轻松解决这个问题,不仅可以实现缩短【长链接→短链接】,也可以实现还原【短链接→长链接】。缩短链接【长链接→短链接】缩短链接,就是把长的要死的链接,缩短到只有几个字符那么长。这么做是为了什么呢?打个比方,如果你们公司搞了一个活动,需要群发营销短信,结果单单活动链接就占据了一页,那就会非常影响活动效果了。所以公司机构往往会使用短链接,将其应用于活动推广、短信推广、邮

2022-04-26 21:33:17 1292

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除