自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(221)
  • 收藏
  • 关注

原创 47页PPT | 如何利用Python进行自动化办公?

之前写过一篇文章,梳理了python在excel、word、ppt、email等领域的应用库,得到很多小伙伴的响应,当然也有质疑的声音。可是,python之所以能协助办公,是因为python作为编程语言,能形成流式处理的工作机制。确实,对于绝大部分人来说,日常的文件、数据处理使用excel、ppt、word就够了。python工具库的学习其实都是机械式的,只要找准方向,每个人都能很快地应用起来。从数据存取、到分析、到报表制作、到分发,只要写好python脚本,就能一劳永逸。

2024-08-30 22:50:59 195

原创 这些可视化Python库非常强!

建立在Javascript plotly库基础上,能使python用户创建基于web的可交互的可视化作品,其能在jupyter notebook上展示,而且可以导出为HTML。的基础上设计的,但是通过使用SQLAlchemy(一种与大多数常见数据库兼容的Python ORM),迅速扩展了范围以支持其他数据库。交互式开源可视化框架,支持超过40种独特图表类型,涵盖统计、财务、地理、学术、三维等。安装好后,启动浏览器端,添加数据源,搭建可视化面板,分享,导出。高度灵活的配置项,可轻松搭配出精美的图表。

2024-08-30 22:50:12 354

原创 python自动化办公?学这些就够用了

这可能是很多非IT职场人士面临的困惑,想把python用到工作中,却不知如何下手?python在自动化办公领域越来越受欢迎,批量处理简直是加班族的福音自动化办公无非是excel、ppt、word、邮件、文件处理、数据分析处理、爬虫这些,这次我就来理一理python自动化办公的那些知识点。下面一一详解。

2024-08-29 22:33:21 818

原创 利用Python将PDF文档转为MP3音频

Python中操作PDF的工具库主要是PyPDF2,但发现编码实在有点繁琐,我就换了另一个库pdfplumber,与PyPDF2语法类似,用起来还算流畅。最近在群里看到有人发张磊的新作《价值》电子书,这本今年刚出的畅销书盗版猖獗,我之前在微信读书里看过,对作者长期主义的观点深信不疑。微信读书有一个功能,可以将书里的文字转换为音频,而且声音优化的不错,比传统的机械朗读听起来舒服很多。简单来说,pyttsx3可以文字转语音,而且是离线工作的,这一点就很实用。我准备动手试试,将PDF书籍转成音频。

2024-08-29 22:30:41 379

原创 20个小技巧,让数据可视化图表更专业!

数据可视化是数据展示的常见方式,所谓一图抵千言,好的图表能高效传递信息,让观众一目了然,差的图表往往会不知所云。人类大脑的一半完全是用于处理可视化信息的。当你给用户展示一张信息图的时候,你已经以大脑的最大带宽路径在影响他了。一张设计优良的数据可视化图能即时给予观者深刻的印象,并能穿透一个复杂故事的芜杂直抵问题的核心。众所周知,纽约时报的可视化图表非常专业,既能阐述事实,也不失简洁美观。作为普通人,其实只要遵守一些设计规则,加上一点审美训练,也能制作出专业的可视化图表。

2024-08-28 23:40:17 872

原创 Python是工程,不是艺术

当Python 于20世纪90年代初期出现在软件行业的舞台上时,曾经引发其拥护者和另一个受欢迎脚本语言Perl的拥护者之问的冲突,而今天这已成为有关编程语言争论的一个经典例子。这是艺术和工程之间关键的差异。实际上,优秀的程序员知道,代码是为下一个会阅读它而进行维护或重用的人编写的。但是,做过任何实质性的代码维护工作的人,应该都可以证实,表达式自由度是很棒的艺术,但是,对工程项目来说就令人恶了。Python 已经历史性地鼓历优秀的工程方式,这是其他脚本语言通常所不具备的,但是接下来的品质故事需要你来书写。

2024-08-28 23:39:29 318

原创 干货!小白入门Python数据科学全教程

本文讲解了从零开始学习Python数据科学的全过程,涵盖各种工具和方法你将会学习到如何使用python做基本的数据分析你还可以了解机器学习算法的原理和使用。

2024-08-27 21:16:47 931

原创 机器学习原理是什么?附sklearn代码

Python中的sklearn库提供了大量机器学习算法调用接口,包括分类、回归、聚类、降维、模型选择、预处理等,你可以自定义参数进行模型调优。你可以为机器学习模型提供大量狗的特征和生活习惯的数据,比如品种、年龄、体重、喝水量、喝水时间、尿尿时间、健康状态等等,直到机器学习模型最终学习到狗尿尿时间与其他特征之间的数学关系,可以推测出大致的的时间点。举个例子,你教小学生玩王者荣耀。现在机器学习的应用已经非常多了,从简单的图像识别、语音识别,到复杂的医疗诊断、股市分析等,还有最近的大模型也属于机器学习的一种。

2024-08-27 10:00:00 511

原创 推荐这三款自动化爬虫软件,非常实用!

网络爬虫是一种常见的数据采集技术,你可以从网页、 APP上抓取任何想要的公开数据,当然需要在合法前提下。与屏幕抓取不同,屏幕抓取只复制屏幕上显示的像素,网络爬虫提取的是底层的HTML代码,以及存储在数据库中的数据。一般使用抓包工具获取HTML,然后使用网页解析工具提取数据。你可以使用Python编写爬虫代码实现数据采集,也可以使用自动化爬虫工具,这些工具对爬虫代码进行了封装,你只需要配置下参数,就可以自动进行爬虫。这里推荐3款不错的自动化爬虫工具,八爪鱼、亮数据、Web Scraper。

2024-08-26 19:29:25 1983

原创 快速提升效率的6个pandas使用小技巧

pandas是python中常用的数据分析库,出现频率非常高。而且pandas功能之多让人咋舌,即使pandas老手也没法保证能高效使用pandas做数据分析,这篇文章就是带大家梳理下那些可以自带buff的pandas小技巧。

2024-08-26 19:27:44 665

原创 高效的5个pandas函数,你都用过吗?

之前为大家介绍过10个高效的pandas函数,颇受欢迎,里面的每一个函数都能帮我们在数据分析过程中节省时间。pandas还有很多让人舒适的用法,这次再为大家介绍5个pandas函数,作为这个系列的第二篇。

2024-08-26 19:26:53 577

原创 为什么有人会觉得会写代码是一项很厉害的技能?

我们现在离不开的微信、淘宝、支付宝、抖音等等都是代码改变生活的典型案例,如今更为火热的智能驾驶汽车不再是机械时代的四轮机器,而变成代码驱动的移动智慧终端。虽然这句话不太严谨,但在大众认知上,程序员是个赚钱多、头发少的职业,起码是能论证上面观点的。因为写代码可以赚钱,能实现NB的功能,而且编程是一个需要不断训练才能掌握的智力活动。不记得在哪看过这样的话,现代人有三大美德,颜值、金钱、智商,码农似乎就能三占其二了。说回代码本身,它其实就是比特时代的自然法则,用0和1构建了一个神奇的世界。

2024-08-23 22:16:24 152

原创 Python一行代码能做什么,这30个案例告诉你

Python语法简洁,能够用一行代码实现很多有趣的功能,这次来整理30个常见的Python一行代码集合。

2024-08-23 22:15:39 187

原创 轻松识别文字,这款Python OCR库支持超过80种语言

检测部分使用了CRAFT算法,识别模型为CRNN,它由3个主要组件组成:特征提取,序列标记(LSTM)和解码​​(CTC)。这段代码有一段参数[‘ch_sim’,‘en’],这是要识别的语言列表,因为路牌里有中文和英文,所以列表里添加了ch_sim(简体中文)、en(英文)。EasyOCR支持超过80种语言的识别,包括英语、中文(简繁)、阿拉伯文、日文等,并且该库在不断更新中,未来会支持更多的语言。细心观察便可发现,身边到处都是OCR的身影,文档扫描、车牌识别、证件识别、银行卡识别、票据识别等等。

2024-08-22 21:16:42 470

原创 关于Python的20个奇技淫巧

Python有非常多有趣使用的技巧,下面列举20个短小精炼的用法,其中既包含常规语法,又有第三方库的妙用,体现了python简单即美的编程哲学。

2024-08-22 21:15:14 218

原创 我“开发“了一款大模型应用,AI门槛这么低了吗?

前面讲了几个在BigModel开放平台上构建大模型应用的案例,这个平台和OpenAI GPTS、以及字节Coze有点类似,它是由智谱AI开发的大模型开发平台。你可以把这类平台想象成一个大厨房,里面提供各种智能工具、模型、API接口、安全、财务管理等等一系列服务,开发者可以根据行业知识来构建自己的AI应用,就像厨师烧菜一样,锅碗瓢盆、油盐酱醋都给你准备好了,烧什么菜由你来决定。比如说开发者关心的API接口,它能接入GLM-4、GLM-4V等主流模型,而且支持各种语言调用。你可以独立部署模型,进行模型微调。

2024-08-21 22:59:16 624

原创 Python selenium爬虫被检测到,该怎么破?

当使用Selenium进行网络爬虫操作时,经常会被目标网站检测到并采取了反爬措施,有几种方法可以尝试规避。大家都知道领英是反爬做的比较好的网站,设置很多反爬措施,对IP进行限制封禁,因此会用到IP代理,用不同的IP进行访问,我这里用的是亮数据的IP代理。亮数据是一家提供网络数据采集解决方案的网站,它拥有全球最大的代理IP网络,覆盖超过195个国家和地区,拥有超过7200万个不重复的真人IP地址。这些IP地址可以用于匿名浏览网页、绕过IP封锁、抓取网页数据等。

2024-08-21 21:48:28 1509

原创 如何使用Web Scraper爬虫抓取数据?

Web Scraper是一个基于Chrome/火狐浏览器的插件,能够在网页上自动爬取数据,提供了丰富的配置,支持自动翻页、登录认证、JavaScript渲染等等,可以解决多数爬虫难题。安装好Web Scraper后,需要在开发者工具中使用它,按F12键打开开发者模式能找到Web Scraper功能区,在这里可以新建并配置爬虫,你也不需要写任何代码就能抓取数据。Web Scraper的安装也很简单,在Chrome应用商店里搜索“Web Scraper”,找到该插件并点击“添加至Chrome”按钮。

2024-08-20 21:28:24 734

原创 使用亮数据爬虫工具解锁复杂爬虫场景

在当今数据驱动型时代,数据采集和分析能力算是个人和企业的核心竞争力。然而,手动采集数据耗时费力且效率低下,而且容易被网站封禁。我之前使用过一个爬虫工具,亮数据(Bright Data) ,是一款低代码爬虫平台,既有现成的爬虫解锁框架,还提供IP代理服务。亮数据基于全球代理IP网络和强大数据采集技术的解决方案,可帮助轻松采集各种网页数据,如产品信息、价格信息、评论信息、社交媒体数据等。

2024-08-20 21:21:40 1264

原创 SQL学习五大步骤

SQL,全称。

2024-08-19 21:21:16 675

原创 Pygal,可导出矢量图的Python可视化利器

Python有很多优秀的可视化库,其中有名的像matplotlib、seaborn、plotly,可以绘制出各式绚丽的图表。这次介绍一个不那么广为人知但依然优秀的可视化库-Pygal官网介绍说Pygal是一个性感的Python制表工具,提供了14种图表类型,可以轻松定制出版级别的交互式图表。相比较seaborn等明星库,Pygal有哪些值得一说的优点呢?

2024-08-17 12:30:27 281

原创 为什么Pandas是最流行的Python数据分析库?

本文将从Python生态、Pandas历史背景、Pandas核心语法、Pandas学习资源四个方面去聊一聊Pandas,期望能带给大家一点启发。

2024-08-17 12:29:26 871

原创 pythonic风格代码有什么好处?附12个代码实例

就好比中文的笔画,有先后顺序,这是前人总结出的最符合文字书写的习惯。最后说下PEP8规范,PEP8是Python的编码规范,其目的在于提高代码的可读性。因为是习惯,不是江湖规则,所以你大可不必遵守pythonic,但如果你想成为python高手,最好是习惯这个习惯。zip() 函数用于将可迭代的对象作为参数,将对象中对应的元素打包成一个个元组,然后返回由这些元组组成的列表。with语句提供一个有效的机制,让代码更简练,同时在异常产生时,清理工作更简单。美胜于丑,简胜于繁,这就是Python哲学。

2024-08-14 21:17:46 301

原创 如何使用python抽取pdf表格及文本,并保存到excel

前面已经介绍过pdfplumber的功能,也用一个小案例展示了如何提取表格,我觉得对于pdfplumber只需要了解三点就可以。1、它是一个纯python第三方库,适合python 3.x版本2、它用来查看pdf各类信息,能有效提取文本、表格3、它不支持修改或生成pdf,也不支持对pdf扫描件的处理Github地址。

2024-08-14 21:16:44 555

原创 聊聊我常用的5款动态数据可视化工具

它已经成为商业BI界的TOP选手,很多大型公司像阿里、谷歌都在使用,能快速搭建数据系统。它是Uber开发的地图可视化工具,能对大规模地理数据进行动态渲染,而且地图场景非常丰富。Python不用多说了,全能选手,是数据科学领域的专业编程语言,可视化也是它的强项。这五款可视化工具差异很大,在各自领域都是学霸级的存在,下面来一一介绍下。官网:https://echarts.apache.org/地图可视化爱好者的福音,这个工具很少被人知道,但非常好用。官网:https://www.python.org/

2024-08-13 20:49:39 340

原创 普通人做数据分析有前(钱)景吗?

很好理解,就是不管做什么岗位,都得精通里面的每个环节、指标、流程、产品等,把分内的东西完完全全摸透,这是基础能力。数据分析本身不需要很NB的IT技能,原来我们用Excel就够了,但后来因为大数据和机器学习的出现,才有了hadoop、hive、spark、python等,所以要看情况,如果对技术感兴趣,现在主流的工具都可以学学,所谓技多不压身。同样是销售,在给客户讲方案的过程中,如果你能基于数据讲出自己的见解故事、对利弊的分析判断,比干巴巴的说产品更能打动客户。,是数据分析从业者能力的最大体现。

2024-08-13 20:48:37 366

原创 五种Pandas图表美化样式汇总

Pandas是一种高效的数据处理库,它以dataframe和series为基本数据类型,呈现出类似excel的二维数据。在Jupyter中,会美化Pandas的输出。不同于IDE展示的文本形式,Jupyter可以通过CSS修改表格的样式。我们在做excel表格的时候,常常会对重要数据进行highlight,或者用不同颜色表示数据的大小。这在Pandas中也是可以实现的,而且非常简洁。Pandas提供了属性,它会返回Styler对象,用以数据样式的美化。

2024-08-13 08:46:23 932

原创 我常用的几个傻瓜式爬虫工具,收藏!

爬虫类工具主要两种,一种是编程语言第三方库,比如Python的scrapy、selenium等,需要有一定的代码基础,一种是图形化的web或桌面应用,比如Web Scraper、后羿采集器、八爪鱼采集器、WebHarvy等,接近于傻瓜式操作,只需要按教程配置即可。对于爬虫小白来说,这几个数据采集工具已经完全够用,不需要你会很多编程技术,只需要知道简单的配置即可,而且对于反爬、动态网页等也能轻松的搞定。八爪鱼支持多种数据类型采集,包括文本、图片、表格等,并提供强大的自定义功能,能够满足不同用户需求。

2024-08-13 08:43:54 2346

原创 使用Matplotlib & Cartopy绘制台风路径图

上文用比较简单的方式绘制了台风路径图,大家可以尝试换个三维地图,或者用动态显示台风走势…玩法挺多的,赶紧尝试尝试吧。

2024-08-11 13:52:58 279

原创 10本Python领域最受欢迎的技术书

以上推荐的都是比较经典的python书,大家看的时候分门类选择其中一两本即可,因为知识点都是通的。

2024-08-11 13:52:06 648

原创 Python Dash 一个可以玩转AI的可视化利器

Dash是一个基于web的Python工具包,所以你只需要会Python 就可以绘制图表、制作报告,无需js、css基础。首先,它是一个可交互的可视化库,可以制作类型丰富的图表,包括统计图表、地图、三维动画等等,并集成到dashboard中。dash拥有大量的开源组件,这些组件可以帮你做生物、物理、化学、机械、汽车等等各方面的分析。dash的国内教程非常少,主要是以官方文档为主,而且是英文的,对初学者来说不那么友好。故而,它最重要的特点是完美集成Python数据科学生态,灵活而强大。

2024-08-09 22:54:47 290

原创 使用Python轻松获取股票&基金数据

先简单介绍下AKShare,内容截至官网。AKShare 是基于 Python 的开源金融数据接口库,目的是实现对股票、期货、期权、基金、债券、外汇等金融产品和另类数据从数据采集,数据清洗到数据下载的工具,满足金融数据科学家、数据科学爱好者在数据获取方面的需求。它的特点是利用 AKShare 获取的是基于可信任数据源发布的原始数据,广大数据科学家可以利用原始数据进行再加工,从而得出科学的结论。代码语法符合 PEP8 规范, 数据接口的命名统一;最佳支持 Python 3.7.5 及其以上版本;

2024-08-09 22:54:05 594

原创 Python里面的self,是谁啊?

类比人类,人类就是一个Python类,每个个体的人代表着实例(对象),而每个人的身份证代表的Python中self,每个人可以凭借身份证去上大学、坐高铁、住酒店…Python的类不能直接使用,只有通过创建实例(对象)才能发挥它的功能,每个实例(对象)都是独一无二的,它可以调用类的方法、属性。初学者会发现,类的方法(构造方法和实例方法)中都会有一个固定参数self,其实这个参数就是代表着实例(对象)本身,就像是一个身份证,实例可以凭着身份证去调用类方法。如果再打印 student_b,会出现同样的结果。

2024-08-08 21:26:02 275

原创 Python常用函数和语句

Python有很多好用的函数和模块,这里给大家整理下我常用的一些方法及语句。

2024-08-08 21:25:16 759

原创 为什么PyCharm这么牛?

这两年被Python初学小白问到最多的问题就是,该用什么代码编辑工具?说实话,我个人是用Jupyter Notebook最多,主要是经常做数据可视化,方便些。但对于初学者来说,PyCharm仍是不二的选择,甚至我建议你只用PyCharm.从当前所有主流Python IDE来看,PyCharm是最适合做Python开发的,特别对新手而言,可以节省很多不必要的时间成本。我也常用PyCharm写脚本,偶尔开发一些web应用,PyCharm的完善程度可以说没有一个IDE能达到。

2024-08-07 23:06:05 863

原创 吴恩达:如何系统学习机器学习?

最近在知乎圆桌里看到吴恩达的回答,【如何系统学习机器学习?】颇为惊喜,仿佛看到了知乎刚成立时的样子,请各个行业大佬来分享专业知识。而他不仅仅是斯坦福的老师,还是coursera创始人、谷歌大脑创始人、百度前首席科学家,在机器学习教育领域算传道士般的存在。吴恩达估计是很多人机器学习的入门领路人,他的cs229课程从斯坦福的校园火到全球,成为最经典的机器学习课程之一。该回答目前已经有三千多赞,评论区也相当火爆,一片膜拜之声。下面把这篇回答原文贴出来,供大家参考下。

2024-08-07 23:03:46 375

原创 吴恩达:如何系统学习机器学习?

最近在知乎圆桌里看到吴恩达的回答,【如何系统学习机器学习?】颇为惊喜,仿佛看到了知乎刚成立时的样子,请各个行业大佬来分享专业知识。而他不仅仅是斯坦福的老师,还是coursera创始人、谷歌大脑创始人、百度前首席科学家,在机器学习教育领域算传道士般的存在。吴恩达估计是很多人机器学习的入门领路人,他的cs229课程从斯坦福的校园火到全球,成为最经典的机器学习课程之一。该回答目前已经有三千多赞,评论区也相当火爆,一片膜拜之声。下面把这篇回答原文贴出来,供大家参考下。

2024-08-07 23:03:16 384

原创 什么是爬虫软件?这两个爬虫神器你必须要试试

爬虫,又称为网络爬虫或网页爬虫,是一种自动浏览互联网的程序,它按照一定的算法顺序访问网页,并从中提取有用信息。用户代理(User-Agent):模拟浏览器访问,避免被网站识别为机器人。请求处理:发送HTTP请求,获取网页内容。内容解析:使用正则表达式或DOM解析技术提取所需数据。数据存储:将提取的数据保存到数据库或文件中。错误处理:处理请求超时、服务器拒绝等异常情况。爬虫软件是一个强大的工具,能够帮助我们从互联网中提取有价值的数据。然而,使用爬虫时也需要注意合法性、效率和对目标网站的影响。

2024-08-06 22:05:13 2436

原创 Python中 __init__的通俗解释是什么?

所以综上,构造方法__init__用于创建实例对象时使用,每当创建一个类的实例对象时,Python解释器都会自动调用它,用来初始化对象的某些属性。顾名思义,就像房子必须有地基、框架、大梁一样,是房子的基础,实例对象也需要有的构造的基础,这就是构造函数的作用,给实例对象最原始的属性。可能你又会问实例对象是什么?每次创建类的实例对象时,__init__函数就会自动被调用,无论它里面有什么样的变量、计算,统统会自动调用。我们通过class来定义类,类又包含了属性、方法等,属性是类里面的变量,方法是类里面的函数。

2024-08-06 21:42:01 333

原创 33个热门数据分析软件,你都用过哪些?

数据分析工具类软件,大体可以分为以下5类:Excel生态工具、数理统计工具、BI工具、数据库工具、编程工具(Excel单独分成一类,主要是因为它应用场景广泛,且用户基数过于庞大,甚至超过其他所有工具用户之和)下面分别就每个工具做简单介绍。

2024-08-06 21:37:48 1279

16个matplotlib绘图技巧

包含了Python Matplotlib库可视化绘图的各种技巧,如标题、文本、注释、坐标轴、图例、颜色等等

2024-04-22

100个Github Python项目

整理了100个在Github上热门的Python项目,包含数据科学、web应用、游戏、可视化、机器学习、自动化等等

2024-04-22

60个Numpy函数和方法解析

Python第三方库Numpy的函数和方法解析

2024-04-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除