自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(658)
  • 收藏
  • 关注

原创 大无语事件,刚过完年,发现到手的年终奖被取消了

最近看到了一个热帖:请大家曝光一下不发年终奖的企业。这跟我们这些打工人关系很大,所以大家比较关系,高达近700的评论,都在讨论这个事。大家跟帖曝光了很多今年年终奖惨淡的公司,不乏一些耳熟能详的公司,国企、私企、银行都有。。。为了在即将的金三银四当中能够找到一份好的工作,下面的Python干货内容还请耐心的看完给照片添加水印给照片添加水印的代码多种多样,下面这种的或许是最为简单的形式,fromPI...

2024-02-29 12:20:19 885

原创 详解Python当中Lambda函数的用法

今天来给大家推荐一个Python当中超级好用的内置函数,那便是lambda方法,本篇教程大致和大家分享什么是lambda函数lambda函数过滤列表元素lambda函数和map()方法的联用lambda函数和apply()方法的联用什么时候不适合使用lambda方法什么是Lambda函数在Python当中,我们经常使用lambda关键字来声明一个匿名函数,所谓地匿名函数,通俗地来讲就是没有名字的函...

2024-02-01 12:05:29 916

原创 介绍一个Python模块,绘制超级惊艳的可视化动图

今天小编给大家介绍一款可视化模块,使用它可以绘制出十分惊艳的动图效果,那么当然第一步我们首先是要安装一下该模块,通过pip命令行来安装pipinstallipyvizzu牛刀小试我们首先来简单地使用该模块来绘制一张动图,用Pandas导入数据集,代码如下importpandasaspdfromipyvizzuimportChart,Data,Configdata_fram...

2024-01-04 12:10:30 868

转载 新年福利!强烈推荐一个Pandas数据分析“神器”(文末送书)

Pandas在Python数据分析领域堪称神器,无论是数据处理还是分析,它都能轻松搞定。然而,想要真正用好Pandas却并不容易,很多同学要么陷入不必要的琐碎细节,关键知识点掌握不牢一用就忘。要么只钻研数据处理技巧而不会分析,导致做了很多无效的数据处理工作,硬生生把Pandas这把屠龙刀变成了棒槌,实在可惜。因此,我给大家推荐阿粥(志鹏)的新书《Python电商数据分析实战:从电商实际案例出发洞悉...

2024-01-01 12:32:32 125

原创 10个超级实用的Python模块,建议收藏!!

Python标准库有超过200个模块,程序员可以在他们的程序中导入和使用,虽然普通程序员对其中许多模块都有一些经验,但很可能有一些好用的模块他们仍然没有注意到。今天小编就来给大家推荐几个特别好用的Python模块,其中有一部分是在Pandas当中的,方便大家使用了之后更加高效地来进行数据分析。xmltodict首先给大家介绍的第三方模块叫做xmltodict,我们从名字上就可以非常直观地看出,该模...

2023-12-28 11:41:05 903

转载 2023年度数据分析项目,建议收藏(数据集)

来源丨大数据文摘对于那些对数据,数据分析或数据科学感兴趣的人,提供一份可以利用业余时间完成的数据科学项目清单,一共14个!项目分为三种类型:可视化项目探索性数据分析(EDA)项目预测建模可视化项目最容易上手的就是数据可视化, 以下3个数据集可以用于创建一些有意思的的可视化效果并加到你的简历中。1. 新冠病毒可视化学习如何使用Plotly构建动态可视化数据,展示冠状病毒是如何在全球范围内传播的。Pl...

2023-12-21 11:47:49 94

转载 还在接着用Pandas?这个数据处理神器得要了解一下了!

cuDF (Pandas GPU 平替),用于加载、连接、聚合、过滤和其他数据操作。cuDF介绍cuDF是一个基于Apache Arrow列内存格式的Python GPU DataFrame库,用于加载、连接、聚合、过滤和其他数据操作。cuDF还提供了类似于pandas的API。GitHub:https://github.com/rapidsai/cudfDocumentation:https:/...

2023-12-18 13:21:59 60

转载 整理了​数据分析入门超详细手册,拿走不谢!

‍大家好!这两天看到一份很不错的数据分析资料合集文档,非常适合自学,包括《十周入门数据分析》PDF文档、100+数据分析实战案例合集、280+数据集和10+行业数据指标体系,质量极高,分享给大家一起学习。????关注数据分析不是个事儿公众号,回复“资料合集”,即可获取全部资料,具体资料往下!《十周入门数据分析》原创文档学习数据分析,最怕的就是东一枪西一炮,没有建立规范的学习体系和规划,这份由李启方老师原...

2023-12-14 12:19:10 83

原创 【实用原创】20个Python自动化脚本,解放双手、事半功倍

在当今的快节奏工作环境中,自动化不再是一种奢侈,而是提高效率和精确性的必需手段。Python,以其易于学习和强大的功能而闻名,成为实现各种自动化任务的理想选择。无论是数据处理、报告生成,还是日常的文件管理,一个简单但有效的Python脚本就能大幅减轻您的工作负担。在本文中,我们将探索如何使用Python来创建多个自动化脚本,它不仅能够节省您的时间,还可以提高工作的准确率和效率。我们先来看第一个自动...

2023-12-11 12:00:08 1013

转载 熬夜整理的机器学习和Python视频教程,附下载链接

今天给大家隆重推荐一位好友:俊欣,公众号【关于数据分析与可视化】的号主,一名爱好编程、有着丰富阅历的数据挖掘工程师。他的公众号已经累积了190+篇的原创,有关于数据分析与可视化方向的、有Python入门实战方向的、也有机器学习、深度学习方向的内容机器学习中的特征工程特征工程对于应用机器学习来说是基础的,但是使用域知识来加强你的预测模型既困难成本又高。为了弥补特征工程现有资料的不足,本书将会为初中级...

2023-12-07 22:12:41 67

原创 Python办公利器:Python-docx,解放双手、事半功倍!!

在处理文档时,我们经常需要一个能够自动化处理Word文档的工具,特别是当涉及到批量生成、修改或分析大量文档时。在Python的丰富生态系统中,python-docx模块应运而生,提供了一个强大的接口来创建和修改Word文档。这个库使得使用Python编程语言进行Word文档处理变得既简单又高效。在本文中,我们将深入探索python-docx的核心功能,介绍如何安装和配置这个库,以及通过实际示例演示...

2023-12-04 12:10:19 829

转载 复旦学子《可解释机器学习》中文版火了,完整PDF开发下载!

可解释性是当下机器学习研究特点之一。最近,来自复旦大学的研究生朱明超,将《Interpretable Machine Learning》翻译成了中文。本文推介由朱明超同学亲自撰写。这本书最初是由德国慕尼黑大学博士Christoph Molnar耗时两年完成的,长达250页,是仅有的一本系统介绍可解释性机器学习的书籍。电子书下载PDF已经打包好,获取步骤如下:1. 点击下方????名片,关注公众号「数据S...

2023-11-30 12:10:29 95

转载 实战干货|Python数据分析消费者用户画像

公众号:关于数据分析与可视化作者:俊欣编辑:俊欣今天给大家介绍一个聚类和降维结合的项目,分为两块内容:直接使用原数据,经过数据预处理和编码后,基于原生的K-Means和PCA/T-SNE实现用户的聚类使用基于Transformer的预训练模型转换后的高维数据,再使用K-Means和PCA/T-SNE实现用户的聚类本文先介绍第一种方案的完整过程。1 项目导图整个项目的导图:2 导入库In [1]:i...

2023-11-30 12:10:29 448 1

原创 Python中社交网络可视化分析模块:PyVis,炫酷的图表信手拈来

在当今数据驱动的世界里,数据的可视化变得越来越重要。特别是在网络分析领域,将复杂的关系网络转换为直观的图形表示,对于理解和传达信息至关重要。在众多的数据可视化工具中,Python的Pyvis库以其简单性和强大的功能脱颖而出。Pyvis是一个专门用于创建和展示网络图的库,它基于JavaScript的vis.js库进行了高效的封装,提供了一种在Python环境中轻松创建交互式网络图的方法。它的使用场景...

2023-11-27 12:52:52 1423

转载 Python数据可视化分析瑞幸和星巴克全国门店分布图

瑞幸会撼动星巴克的行业地位吗?上个月瑞幸咖啡的酱香拿铁火出圈,让瑞幸再一次出现在聚光灯下,上一次还是财务造假的时候。这几年国内咖啡市场火热,带动瑞幸在内的很多咖啡品牌飞速发展,从2013年到2023年,预计中国人均咖啡消费量上涨了238%,现在全国合计咖啡门店数量已超10万家,且以每年上万家的数量在增长。瑞幸咖啡的崛起让我们想到咖啡界的标杆-星巴克,星巴克几乎是过去十几年咖啡的代名词,也是城市白领...

2023-11-24 12:05:19 323

原创 Python工程师面试高频题:return 和 yield之间到底有啥区别?

在编程语言 Python 中,yield 和 return 是两个在函数中用于返回值的关键字,但它们在功能和使用场景上有着本质的区别。理解这两者的区别,对于编写更高效、更灵活的 Python 代码至关重要。看图说话首先我们来看下面这张图片,该图片比较生动形象地描绘了 return和 yield 之间的区别,想象你走进一个美食节,这里有两个卖Takoballs(章鱼丸子)的摊位,一个是“Return...

2023-11-21 12:25:38 31

转载 强烈推荐一位数据挖掘工程师

今天给大家隆重推荐一位好友:Peter,公众号【尤而小屋】的主理人,一名爱好美食的数据挖掘工程师。985硕士毕业后Peter自学Python转行数据科学,喜欢Python、机器学习、爬虫、数据分析、可视化,创作主要有:《Pandas图解入门教程》,《高级可视化神器Plotly入门实战》,《机器学习kaggle案例分析》,《MySQL经典50题》。关注公众号:尤而小屋,一个温馨且有爱的小屋尤而小屋原...

2023-11-18 16:09:11 41

转载 Python时间序列分析库介绍:statsmodels、tslearn、tssearch、tsfresh

转自:DeepHub IMBA在本文中,我们将介绍四个主要的Python库——statmodels、tslearn、tssearch、tsfresh——每个库都针对时间序列分析的不同方面进行了定制。这些库为从预测到模式识别的任务提供了强大的工具,使它们成为各种应用程序的宝贵资源。我们使用来自Kaggle的数据集,通过加速度计数为各种身体活动进行分析。这些活动被分为12个不同的类别,每个类别对应一个...

2023-11-16 12:00:59 111

转载 太实用了!scikit-plot 模型可视化神器

对训练好的模型进行可视化,功能比较简单易懂。scikit-learn (sklearn)是Python环境下常见的机器学习库,包含了常见的分类、回归和聚类算法。在训练模型之后,常见的操作是对模型进行可视化,则需要使用Matplotlib进行展示。scikit-plot是一个基于sklearn和Matplotlib的库,主要的功能是对训练好的模型进行可视化,功能比较简单易懂。https://scik...

2023-11-14 12:20:10 54

转载 盘点机器学习中十大算法的优缺点

逻辑回归二项logistic回归模型是一种分类模型,由条件概率分布P(Y|X)表示,形式为参数化的logistic分布。这里随机变量X取值为实数,随机变量Y取值为1或0。可以通过有监督的方法来估计模型参数。优点:1. 计算代价不高,易于理解和实现;2. 适用于需要得到有分类概率额场景;3.对小数据噪声的鲁棒性好,不会收轻微的多重共线性的影响缺点:1. 容易欠拟合,分类精度可能不高;2.数据有缺失和...

2023-10-26 12:22:24 89

转载 Python中进行特征重要性分析的9个常用方法

作者丨Roushanak Rahmat来源丨Deephub Imba特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征,它是机器学习中经常使用的一种方法。为什么特征重要性分析很重要?如果有一个包含数十个甚至数百个特征的数据集,每个特征都可能对你的机器学习模型的性能有所贡献。但是并不是所有的特征都是一样的。有些可能是冗余的或不相关的,这...

2023-10-10 12:02:18 153

转载 PyTorch使用高频代码段集锦,建议收藏!

公众号:关于数据分析与可视化整理:欣本文是PyTorch常用代码段合集,涵盖基本配置、张量处理、模型定义与操作、数据处理、模型训练与测试等5个方面,还给出了多个值得注意的Tips,内容非常全面。PyTorch最好的资料是官方文档。本文是PyTorch常用代码段,在参考资料[1](张皓:PyTorch Cookbook)的基础上做了一些修补,方便使用时查阅。基本配置 导入包和版本查询importt...

2023-10-03 11:24:25 83

转载 卧槽!又一个Python神器!

小二是我的朋友,整理了一些Python学习神器资料,有需要的小伙可以自行免费领取。1.200+Python练手案例:点击下方卡片关注公众号Python小二回复关键词247免费领取2.Python全套视频教程等:点击下方卡片关注公众号Python小二回复关键词p1免费领取3.浙大Python学习套装:点击下方卡片关注公众号Python小二回复关键词浙大免费领取4.Python实战案例:点击下方卡片关...

2023-09-25 12:13:26 72

转载 惊艳到了,像艺术品一样来制作数据可视化!(文末送书)

????点击“博文视点Broadview”,获取更多书讯你知道吗?原来数据可视化可以做得像殿堂级艺术品一样!博文菌最近看到一本书,第一眼就被它吸引过去了,因为它和平常的技术书实在是长得太不一样了!它的装帧设计更像是一本艺术书~~但它却是一本讲数据可视化的书——《数据可视化创意手记》!先随手拿一本书放在它面前,大家就能感觉出这本书的不一样了,首先个头就大了普通书许多!虽然是本大书,但是它的阅读体验感却让人...

2023-09-23 12:10:29 119

原创 【实战】Streamlit+ECharts绘制多图表可视化大屏,超级实用

实战项目背景介绍当我们提到数据可视化,常常会想到众多的工具和库,如 Matplotlib、Seaborn 甚至于 D3.js 等。但是,有一个特定的组合正在快速走红:Streamlit 和 ECharts。Streamlit,作为一个轻量级的 Python 工具,允许数据科学家和工程师轻而易举地创建交互式的 web 应用。而 ECharts,一款来自百度的开源 JavaScript 可视化工具,因...

2023-09-19 11:48:36 1742 1

转载 10 个图像处理的Python库,超实用!

在这篇文章中,我们将整理计算机视觉项目中常用的Python库,如果你想进入计算机视觉领域,可以先了解下本文介绍的库,这会对你的工作很有帮助。PIL/PillowPillow是一个通用且用户友好的Python库,提供了丰富的函数集和对各种图像格式的支持,使其成为开发人员在其项目中处理图像的必要工具。它支持打开、操作和保存许多不同的图像文件格式,用户还可以对图像执行基本操作,如裁剪、调整大小、旋转和更...

2023-09-14 12:15:10 87

转载 大模型时代下,面向小白的机器学习基础知识点汇总!!

1. 机器学习概述1)什么是机器学习人工智能(Artificial intelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是一个笼统而宽泛的概念,人工智能的最终目标是使计算机能够模拟人的思维方式和行为。大概在上世纪50年代,人工智能开始兴起,但是受限于数据和硬件设备等限制,当时发展缓慢。机器学习(Machine learning)是人工...

2023-09-07 12:15:52 150

原创 Streamlit+Echarts画出的图表,真的是太精湛了!!

在数据分析和可视化的领域,选择合适的工具可以让我们事半功倍。今天,我们要介绍的两个工具,Streamlit 和 ECharts,各自在快速应用开发和高效数据可视化方面都有出色的表现。更为令人兴奋的是,当这两者结合时,我们能轻松地创建出互动性强、美观的数据大屏。工具的简介StreamlitStreamlit是一个开源的Python库,允许数据科学家和工程师在几分钟内转化他们的数据脚本为交互的Web应...

2023-09-05 11:21:10 374

转载 将 Pandas 换为交互式表格的 Python 库

Pandas是我们日常处理表格数据最常用的包,但是对于数据分析来说,Pandas的DataFrame还不够直观,所以今天我们将介绍4个Python包,可以将Pandas的DataFrame转换交互式表格,让我们可以直接在上面进行数据分析的操作。PivottablejsPivottablejs是一个通过IPython widgets集成到Python中的JavaScript库,允许用户直接从Data...

2023-09-01 11:58:40 75

转载 《图解线性代数》中文版.PDF

本次分享一份线性代数干货PDF:图解线代中的矩阵分解、奇异值分解、特征值、对角化等概念,人人都能看懂!《图解线性代数》高清PDF 已经打包好,获取步骤如下:1,点击下方公众号数据STUDIO名片2,关注数据STUDIO后,在消息后台回复线性代数▲点击关注「数据STUDIO」回复线性代数注意⚠️是公众号『数据STUDIO』,非本号例如,参考书籍为MIT数学大佬教授Gilbert Str...

2023-08-30 13:12:34 542

转载 10个简单但超级有用的Python装饰器,事半功倍

装饰器(Decorators)是Python中一种强大而灵活的功能,用于修改或增强函数或类的行为。装饰器本质上是一个函数,它接受另一个函数或类作为参数,并返回一个新的函数或类。它们通常用于在不修改原始代码的情况下添加额外的功能或功能。装饰器的语法使用@符号,将装饰器应用于目标函数或类。下面我们将介绍10个非常简单但是却很有用的自定义装饰器。@timer:测量执行时间优化代码性能是非常重要的。@ti...

2023-08-28 11:28:59 68

转载 当 Pandas 遇上 ChatGPT 之后

来源丨数据STUDIOPython Pandas是一个为Python编程提供数据操作和分析功能的开源工具包。这个库已经成为数据科学家和分析师的必备工具。它提供了一种有效的方法来管理结构化数据(Series和DataFrame)。在人工智能领域,Pandas经常用于机器学习和深度学习过程的预处理步骤。Pandas通过提供数据清理、重塑、合并和聚合,可以将原始数据集转换为结构化的、随时可用的2维表格,...

2023-08-16 11:35:29 91

转载 招商银行的数字化应用实践(附PPT)

近日,招商银行研发中心高级架构师陈翔莅临观远数据2022智能决策峰会,带来《基于数据驱动的招行数字化应用实践》主题分享,详细介绍了招商银行「圆方数据分析平台」建设的前世今生。从用户痛点需求到“让业务用起来”的企业价值,从平台技术建设到运营推广,从应用现状到升级规划,深度讲解招商银行领先的数据分析平台建设经验,为更多期望实现“数据驱动”的企业提供路径参照。以下为招商银行研发中心高级架构师陈翔的演讲实...

2023-08-15 17:32:28 151

转载 Jupyter 集成ChatGPT,零基础小白都能学会的编程

转自:机器之心Jupyter 在其环境中添加了基于 LLM 的聊天机器人。现在,大语言模型(LLM)与 Jupyter 连接起来了!这主要归功于一个名叫 Jupyter AI 的项目,它是官方支持的 Project Jupyter 子项目。目前该项目已经完全开源,其连接的模型主要来自 AI21、Anthropic、AWS、Cohere、OpenAI 等各大明星公司和机构。项目地址:https://...

2023-08-10 11:42:59 226

转载 面向小白的本地部署大模型完整教程:LangChain + Streamlit+ LLama

在过去的几个月里,大型语言模型(llm)获得了极大的关注,这些模型创造了令人兴奋的前景,特别是对于从事聊天机器人、个人助理和内容创作的开发人员。大型语言模型(llm)是指能够生成与人类语言非常相似的文本并以自然方式理解提示的机器学习模型。这些模型使用广泛的数据集进行训练,这些数据集包括书籍、文章、网站和其他来源。通过分析数据中的统计模式,LLM可以预测给定输入后最可能出现的单词或短语。目前的LLM...

2023-07-28 12:09:14 2227

转载 【干货】介绍Python中的模块,轻松将PDF转换成docx

可将 PDF 转换成 docx 文件的 Python 库。该项目通过 PyMuPDF 库提取 PDF 文件中的数据,然后采用 python-docx 库解析内容的布局、段落、图片、表格等,最后自动生成 docx 文件。pdf2docx功能解析和创建页面布局页边距章节和分栏 (目前最多支持两栏布局)页眉和页脚 [TODO]解析和创建段落OCR 文本 [TODO]水平(从左到右)或竖直(自底向上)方向...

2023-07-24 12:00:10 120

转载 你的论文配图离高颜值高Bigger之间,就差这本书了!

小异的朋友最近在做实验和写论文,每次把实验配图拿给导师看,导师都说差点意思。“差点意思”到底差在哪里了啊?在网络上搜索关于科研配图的信息都很零碎,大多都是小技巧推荐,那有没有一本系统介绍科研论文配图绘制的书呢?我给朋友推荐了最近的一本新书——《科研论文配图绘制指南:基于Python》。▲点击封面即可购书,限时特惠5折本书系统地介绍了用Python绘制科研论文配图的方法和技巧,就像一场科研配图绘制...

2023-07-05 16:57:26 153 1

转载 从Pandas到Polars :数据的ETL和查询

来源:Deephub Imba对于我们日常的数据清理、预处理和分析方面的大多数任务,Pandas已经绰绰有余。但是当数据量变得非常大时,它的性能开始下降。本文将介绍如何将日常的数据ETL和查询过滤的Pandas转换成polars。Polars的优势Polars是一个用于Rust和Python的DataFrame库。Polars利用机器上所有可用的内核,而pandas使用单个CPU内核来执行操作。P...

2023-06-19 12:00:14 176

转载 YYDS!用Python就能轻松控制你的手机

“Python编程几乎能做任何事,只要你敢想,敢尝试!”,今天来看下用Python代码怎么来控制你的安卓手机。具体的说是代替你的手,实现自动的触摸和一些动作,实现自动化操作!主要用的是安卓手机的Android调试桥(AndroidDebug Bridge),它是一个非常有用的工具!本文的这个快速指南中,我将向你展示如何使用Python代码与ADB交互,并如何创建2个快速脚本。ADB(Androi...

2023-06-05 12:25:56 933

转载 58 个程序员必知的网站,赶紧收藏!!

来源丨网络程序员是一个需要不断学习的职业。幸运的是,在这个互联网时代,知识就在那里,等着我们去获取。作为一个“收藏从未停止,学习从未开始”的博主,秉承着好东西不能独享的态度,把收藏的学习网站整理分享出来,希望大家不要学我,一定要好好学习,天天进步,升职加薪。01在线教程首先列出一些在线教程网站,这些在线教程网站通常都比较适合入门,可以作为开发学习路上的第一个阶梯,也可以作为工作中的在线文档。1、h...

2023-05-26 12:27:51 445

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除