自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

早起Python

专注于Python爬虫/数据分析

  • 博客(31)
  • 资源 (1)
  • 收藏
  • 关注

原创 我安装Python第三方库的几种姿势

========欢迎关注我的公众号:之前python=======要说使用Python中最让人头疼的过程,不是程序崩溃代码报错,而是卡在安装某个依赖库上,因为报错的代码千篇一律但安装失败的情况千奇百怪,因此本文将介绍我在安装第三方库遇到问题时的一般操作。在安装某个库的时候,首先当然是直接pip,比如pip install pandas,可是在某些时候会发现下载速度只有1kb/秒,甚...

2020-03-31 12:06:21 944

原创 不能再简单了|手把手教你爬取美国疫情实时数据

==========欢迎关注我的公众号:早起python有问题可以后台给我留言============大家好,最近一直有读者在后台留言说早起能不能写一下怎么获取国外的疫情数据、美国疫情数据怎么爬之类的。为了满足各位,今天就说一下如何爬取美国疫情数据。废话不多说,直接开始,只需一台电脑,按照下面的顺序一步一步执行,爬不下来数据你打我,文末不提供源码,源码一字不少全在文中。首...

2020-03-29 11:02:36 5564 7

原创 Pandas进阶修炼120题|当Pandas遇上NumPy

==================欢迎关注我的公众号:早起python=================大家好,本文接着更新Pandas进阶修炼120题,Pandas的强大不仅仅因为它自身的强大,更在于当它和NumPy、Matplotlib、Sklearn等库结合使用时发挥的巨大威力,本期就挑选了一些Pandas+NumPy相关的题目供各位读者练习,如果感兴趣,请一定要敲一遍代码。...

2020-03-28 10:55:13 1939 2

原创 Python告诉你想开一家美食店该怎么做

前言大家好,又到了Python爬虫+数据分析可视化的专题,今天案例是对美团网杭州市美食团购的数据进行分析,如果已经或者最近有打算开一家美食团购店铺的读者,希望本文能对你有所帮助。数据获取本次案例需要爬取的目标网站为美团网web端杭州市美食页面方法还是和之前的一样,F12查看数据包,找到对应的url再使用requests爬取数据由于这部分操作我们已经使用来很多次,并...

2020-03-27 13:38:18 976

原创 一个例子带你入门Python装饰器

============欢迎关注我的公众号:早起python============前言在还未正式发布的python3.9中,有一个新功能值得关注,那就是任意表达式可以作为装饰器,如果你还不知道装饰器是什么,没关系,跟着本文一个例子搞明白,不过需要你对Python中的类(Class)有一定的了解,因为我们一般在类中使用。一个例子关于装饰器是什么,随便一搜都能找到一堆解释。我...

2020-03-26 11:14:59 1071

原创 Pandas进阶修炼120题|金融数据处理

本文为Pandas进阶修炼120题系列第三期,前两期戳Pandas进阶修炼120题|第一期​mp.weixin.qq.comPandas进阶修炼120题|第二期​mp.weixin.qq.com今天的内容主要为Pandas处理金融(股票)数据相关操作,包含异常值处理、数据可视化、指标计算等,我们开始吧!51数据读取题目:使用绝对路径读取本地Excel数据难度:⭐答案...

2020-03-25 11:45:20 2389 2

原创 Python使用pdb更优雅的调试代码

什么是pdb不知道大家在用Python写代码出现报错时是怎样调试的,从报错提示定位回去一步一步check每一行?如果没有IDE或者命令行写代码时又该怎样快速调试?这时如果使用pdb进行调试将会异常方便。Pdb就是Python debugger ,是python自带的调试器。通过 pdb 我们可以交互式的查看运行过程中变量的值、设置断点、逐行执行代码、查看代码的调用栈等等。并且如果环境没有 ...

2020-03-24 15:10:46 1400

原创 Pandas进阶修炼120题|第二期

==============欢迎关注首发公众号:早起python==============大家好,Pandas进阶修炼120题系列旨在用刷题的方式彻底玩转pandas中各种操作,本期为第二期,我们开始吧~21数据读取题目:读取本地EXCEL数据难度:⭐答案df = pd.read_excel('pandas120.xlsx')本期部分习题与该数据相关...

2020-03-23 10:32:30 1294

原创 Pandas进阶修炼120题|第一期

=============欢迎关注文章首发公众号:早起python=============在『Pandas进阶修炼120题』系列中,我们将对pandas中常用的操作以习题的形式发布。从读取数据到高级操作全部包含。如果你是新手,可以通过本系列完整学习使用pandas进行数据处理的各种方法,如果你是高手,欢迎留言给出与答案的不同解法。本期先来20题热身吧!1创建DataFrame...

2020-03-22 16:44:38 1760 2

原创 怎样绘制漂亮的统计图表|柱状图的正确打开方式

点击上方『早起python』关注早起和我一起,成为更好的自己前天我们在公众号『早起python』与『可乐的数据分析之路』开启了『怎样绘制漂亮的统计图表』系列专题,在两天的时间内我们收到一些...

2020-03-22 10:25:03 831

原创 怎样绘制漂亮的统计图表|第一期

点击上方『早起python』关注早起和我一起,成为更好的自己大家好,最近分享了一些关于数据分析可视化相关的内容,其实在数据分析过程中,基本就是数据采集与处理,再通过描述性分析来探索数据,最...

2020-03-20 09:12:48 1031

原创 技术解析|如何绘制密度分布图

点击上方『早起python』关注早起和我一起,成为更好的自己前言在前几天对数据分析师与算法工程师进行岗位对比分析的文章中,我们使用了密度分布图和箱线图对薪资水平与学历对薪资的影响进行了分析...

2020-03-20 09:12:48 4572

原创 一些疫情数据分析的思路,文末提供最新数据与代码

点击上方『早起python』关注早起和我一起,成为更好的自己前言最近有一些读者后台咨询如何针对疫情数据做一些分析,甚至还有做毕业论文的关于如何获得最新的疫情数据,在之前的文章已经详细介绍了...

2020-03-19 10:25:38 1444 1

原创 使用Python进行统计建模

点击上方『早起python』关注早起和我一起,成为更好的自己前言大家好,在之前的文章中我们已经讲解了很多Python数据处理的方法比如读取数据、缺失值处理、数据降维等,也介绍了一些数据可视...

2020-03-19 10:25:38 663 1

原创 数据分析师还是算法工程师|用数据多角度解读如何选择

前言疫情即将散去,又到了求职季。学习Python的各位该如何选择自己的职业方向,算法工程师还是数据分析师?跟随本文一起看看吧!01 数据获取与处理本次样本数据采集于拉勾网,因为本文的重点是招聘数据分析,而在之前的文章中我们讲解过很多次如何使用requests爬取网页数据,这里就不再赘述,来看下爬取网站部分代码url_html ='https://www.lagou.com/jo...

2020-03-17 10:11:05 13142 8

原创 类和函数傻傻分不清楚?三个例子讲明白

前言前两天一位小伙伴问了这样一个问题:虽然已经使用python一年多了,也用python写过很多脚本,代码量从几十行到上千行的也有,但从未使用过类(class),似乎用函数(def)就能解决所有问题,使用类有什么好处?我什么时候该用类呢?关于这个问题,算是困惑了许多刚接触python的同学,那么本文就尝试从多个角度来解读这个问题。首先还是先来看看官方给出类与函数的解释。类提供了一种组合...

2020-03-16 09:50:26 3033 4

原创 使用Python进行数据降维|线性降维

前言为什么要进行数据降维?直观地好处是维度降低了,便于计算和可视化,其深层次的意义在于有效信息的提取综合及无用信息的摈弃,并且数据降维保留了原始数据的信息,我们就可以用降维的数据进行机器学习模型的训练和预测,但将有效提高训练和预测的时间与效率。降维方法分为线性和非线性降维,非线性降维又分为基于核函数和基于特征值的方法(流形学习),代表算法有线性降维方法:PCA ICA LDA LFA...

2020-03-15 11:41:43 2132

原创 上班摸鱼系列|Python开发命令行斗地主

前言大家周末好~最近更新了太多的数据分析内容不知道各位有没有疲劳,今天给大家带来的是如何上班如何高级摸鱼:用Python开发一个命令行斗地主小游戏,利用跑程序的时间来一把斗地主岂不是非常快乐,关键是没有时间限制,不仅可以喊上老板一起玩还能随时断点续玩doudizhu.mov接下来简单讲讲如何使用python开发这样一个斗地主游戏,我们先来想想进行一场斗地主游戏所经历的过程:首先生成5...

2020-03-14 10:50:35 1423 2

原创 常用统计检验的Python实现

前言今天给大家整理了一些使用python进行常用统计检验的命令与说明,请注意,本文仅介绍如何使用python进行不同的统计检验,对于文中涉及的假设检验、统计量、p值、非参数检验、iid等统计学相关的专业名词以及检验背后的统计学意义不做讲解,因此读者应该具有一定统计学基础。正态性检验正态性检验是检验数据是否符合正态分布,也是很多统计建模的必要步骤,在Python中实现正态性检验可以...

2020-03-13 10:27:43 2756

原创 简单4步用FLASK/Django部署你的Pyecharts项目

前言为什么将pyecharts与web框架结合使用?因为如果只是单纯的使用pyecharts,我们展示的时候只能将我们的图表生成为静态文件,虽然也在也可以使用iframe等语句嵌入前端页面但是并不方便前后端数据交互。如果我们在Flask/Django/Tornado/Sanic中使用pyecharts就结合通过这些web框架来实现前后端分离或使用动态更新数据,增量更新数据(比如前端主动向后...

2020-03-12 10:12:20 1394

原创 快速提高Python数据分析速度的八个技巧

今天整理了几个在使用python进行数据分析的常用小技巧、命令。记得搭配Pandas+Jupyter Notebook使用哦。01 使用PandasProfiling预览数据这个神器我们在之前的文章中就详细讲过,使用PandasProfiling可以在进行数据分析之前对数据进行快速预览,拿我们使用过很多次的NBA数据集来说,导入数据集之后importpandas...

2020-03-11 09:33:29 7180

原创 Matplotlib:先搞明白plt. /ax./ fig再画

点击上方“早起python”,关注早起和我一起,成为更好的自己本文作者:姚太多啊我这个傻子的matplotlib学习过程很神奇:刚开始,找几个教程,呕吼,简单,plt.*** 一顿写。画完...

2020-03-10 09:49:43 483 1

原创 Python解放双手系列——用python自动追踪你的快递

前言最近国内疫情状况好转,快递业也逐渐恢复,大家的快递是不是跑起来了?本文就来讲解如何让python自动为你查询快递信息,并在物流发生更新或者到达指定地点时第一时间将物流推送至你的邮箱其实并不复杂,只需要两步即可搞定:爬取物流动态信息 将信息推送至邮箱物流追踪先说一下走过的坑,在一开始的思路就是去找个快递查询的网站查一下快递,然后抓一下包就能拿到我们需要的内容,然后写个爬虫...

2020-03-09 14:34:01 3371

原创 收下这份来自GitHub的神器,一图搞定Matplotlib!

今天的文章没有太多废话,给大家分享一位GitHub大神制作的Matplotlib cheat sheet,直接看图⬇️那么我们来看看这张图里到底藏了哪些宝贝。使用方法我想也不用多说,下载设为壁纸或者打印贴在电脑旁还是做成鼠标垫?总之哪里有Matplotlib哪里就有它!原版高清大图可在『早起py...

2020-03-08 09:29:25 782

原创 近期热门文章汇总

点击上方“早起python”,关注公众号满满干货,极速送达热门文章汇总(????猛戳可查看)热门文章:➤情人节用python写个网站对ta表白吧!➤武大樱花又盛开,用python画一棵樱花...

2020-03-07 14:03:37 107

原创 高考倒计时100天,用python看看高三党

点击上方“早起python”,关注公众号满满干货,极速送达一、前言本文为python爬虫+可视化系列第五篇,前几篇请猛戳文末链接~希望能通过详解一些简单的小项目来学习python。今天要做...

2020-03-07 14:03:37 955 1

原创 Python爬取网易云音乐1万条评论,感受到疫情下的真情

一、前言昨天打开网易云音乐被这条视频刷屏了⬇️致敬所有疫情前线的工作人员!​music.163.com1600万+的播放量,1.3万+的评论那么今天我们用python看看这些评论里留下了哪些感人的故事,二、数据抓取首先,我们用电脑打开网易云音乐这条视频的链接。找到最新评论,目标就是把这些评论全部取出来。接着发现每点击“下一页”,网站的url并没有任何变化,说明整个评论区...

2020-03-06 12:14:32 2477 2

原创 武大樱花又盛开,用python画一棵樱花树

点击上方“早起python”,关注公众号满满干货,极速送达黑夜可能漫长,但总会迎来温暖的阳光,三月如期而至,武大的樱花又一次盛开。那么今天就一起来看看怎样在python中画一棵美丽的樱花树...

2020-03-05 13:08:33 242

原创 技术解析:如何用pyecharts绘制时间轮播图

点击上方“早起python”,关注公众号满满干货,极速送达在前天的文章『用python制作动态图表看全球疫情变化趋势』中,由于篇幅原因,在数据处理与数据可视化相关内容上我们只是简单带过,那...

2020-03-05 13:08:33 345

原创 技术解析:如何获取全球疫情历史数据并处理 刘早起

在昨天的文章『用python制作动态图表看全球疫情变化趋势』中,由于篇幅原因,在数据处理与数据可视化相关内容上我们只是简单带过,那么我将以python小小白的角度去还原如何处理数据与数据可视化。本文为第一篇:获取数据并处理。一、数据获取一开始就有一个问题摆在面前,疫情数据哪里获取。虽然国内很多网站都提供了疫情的跟踪报道,但是并没有找到提供完整历史数据的网站,所以想直接从网站爬数据的思路就暂...

2020-03-04 16:25:16 6790 6

原创 Python一行命令生成数据分析报告

一般在python进行数据分析/统计分析时,第一步总是对数据进行一些描述性分析、相关性分析,但是总会是有一大堆代码,那么今天就介绍一个神器pandas_profiling,一行命令就能搞定大部分描述性分析!安装pipinstallpandas_profiling使用那么我们继续使用之前文章中使用过很多次的NBA数据集,还记得我们在介绍pandas使用的那篇文章...

2020-03-01 19:37:34 1081

Python查快递软件

Python查快递软件,需要找一张背景图片命名为bg1.png即可,或者删除掉背景图片相关代码。

2020-05-02

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除