![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
文章平均质量分 72
python收藏家
这个作者很懒,什么都没留下…
展开
-
Pandas中将列类型从字符串转换为日期时间格式
在上面的例子中,我们将列“Treatment_start”和“Treatment_end”的数据类型从“object”更改为“datetime64[ns]”类型。在上面的示例中,我们将列“Dates”的数据类型从“object”更改为“datetime64[ns]”,格式从“yymmdd”更改为“yyyymmdd”。正如我们在输出中所看到的,“Date”列的格式已更改为datetime格式。正如我们在输出中所看到的,“Date”列的格式已更改为datetime格式。原创 2024-06-24 17:46:31 · 309 阅读 · 0 评论 -
Python | 在Numpy中使用argsort方法进行排序
argsort() 是 NumPy 库中的一个函数,它的功能是对数组中的元素进行从小到大的排序,并返回相应元素的原始数组下标。这些下标可以用来以排序顺序重新构造原数组或获取排序后数组元素的原始位置。具体来说,当你对一个 NumPy 数组调用 argsort() 函数时,它会返回一个新的数组,这个新数组的元素是原数组元素排序后的索引。例如,如果原数组是 [2, 1, 4, 3],那么 argsort() 会返回 [1, 0, 3, 2],因为 1 是原数组中的最小元素,其索引是 1;原创 2024-06-21 19:06:40 · 268 阅读 · 0 评论 -
Python | 自动探索性数据分析(EDA)库SweetViz
SweetViz是一个开放源代码Python库,主要用于生成精美的高密度可视化文件,启动探索性数据分析(EDA),输出为完全独立的HTML应用程序。探索性数据分析(EDA)是分析和总结数据集主要特征的过程,通常旨在了解数据中的潜在模式,关系和趋势。原创 2024-06-02 20:31:27 · 583 阅读 · 0 评论 -
Pandas格式化DataFrame的浮点数列
在呈现数据的同时,以所需的格式显示数据也是一个重要而关键的部分。有时,值太大了,我们只想显示其中所需的部分,或者我们可以说以某种所需的格式。让我们看看在Pandas中格式化DataFrame的数值列的不同方法。原创 2024-05-29 18:31:19 · 279 阅读 · 0 评论 -
基于Seaborn和Matplotlib的可视化案例分析
处理数据有时会有点无聊。将原始数据转换为可理解的格式是整个过程中最重要的部分之一,那么为什么只停留在数字上,当我们可以将数据可视化为令人兴奋的图表时,这些图表可以在python中获取。这篇文章将重点探索耐人寻味的预处理之旅。Seaborn和Matplotlib为我们提供了许多诱人的图表,通过这些图表,人们可以轻松地分析关键点,更深入地了解数据,并最终获得对数据的深刻见解,并在通过不同算法训练后获得最高的准确性。原创 2024-02-11 20:16:10 · 973 阅读 · 0 评论 -
将Lambda函数应用于Pandas DataFrame
在Python Pandas中,我们可以在需要时自由添加不同的函数,如lambda函数,排序函数等。我们可以将lambda函数应用于Pandas数据框的列和行。语法:lambda参数:表达式一个匿名函数,我们可以立即传入,而无需定义名称或任何东西,就像一个完整的传统函数一样。原创 2024-01-28 19:04:51 · 610 阅读 · 0 评论 -
使用Python检测并删除离群值
离群值是一个数据项/对象,它明显偏离其余的(所谓的正常)对象。它们可能由测量或执行错误引起。离群点检测的分析被称为离群点挖掘。检测离群值的方法有很多,删除过程与从pandas的数据框中删除数据项相同。原创 2024-01-23 19:06:50 · 1656 阅读 · 0 评论 -
Pandas中不同类型的join操作
Pandas模块包含各种功能,可以在数据框上执行各种操作,如join,concatenate,delete,add等。在本文中,我们将讨论可以在Pandas数据框上执行的各种类型的join操作。Pandas中有五种类型的Join。为了理解不同类型的连接,我们将首先创建两个DataFrame,即a和b。原创 2024-01-20 19:38:53 · 888 阅读 · 0 评论 -
时间序列数据中的趋势及可视化示例
时间序列数据是在有序的时间段内测量某些变量的数据点序列。它是增长最快的数据库类别,因为它广泛用于各种行业,以了解和预测数据模式。因此,在准备这些时间序列数据进行建模时,检查时间序列组件或模式非常重要。其中之一就是趋势。趋势是数据中的一种模式,它显示了一个系列在很长一段时间内相对较高或较低的值的运动。换句话说,当时间序列中存在增加或减少的斜率时,观察到趋势。趋势通常发生一段时间,然后消失,它不会重复。例如,一首新歌出现,它流行了一段时间,然后就消失了。它很有可能再次成为趋势。原创 2024-01-18 17:40:08 · 575 阅读 · 0 评论 -
使用Python进行客户行为分析
客户行为分析是一个有价值的过程,它使企业能够做出数据驱动的决策,增强客户体验,并在动态市场中保持竞争力。因此,这个过程从基于平台上的客户行为收集数据开始。原创 2024-01-12 18:34:28 · 441 阅读 · 0 评论 -
Pandas DataFrame中将True/False映射到1/0
在本文中,我们将看到如何在Pandas DataFrame中将True/False映射到1/0。True/False到1/0的转换在执行计算时至关重要,并且可以轻松分析数据。原创 2024-01-06 17:39:58 · 546 阅读 · 0 评论 -
使用Python进行用户参与度分析
用户参与度分析有助于企业了解人们如何与他们的产品或服务互动,使他们能够做出改进,使用户更快乐,更有可能留下来。它可以帮助企业为客户创建更好的UI/UX,并最终实现他们的目标。用户参与度分析可帮助各种类型的企业,包括电子商务、社交媒体、移动的应用程序和在线平台。例如,电子商务公司可以使用它来了解客户如何浏览他们的网站,他们喜欢什么产品,以及他们在每个页面上停留的时间。它可以帮助公司优化他们的网站设计,个性化的产品推荐,并改善营销策略,以提高客户满意度和忠诚度。原创 2024-01-03 16:59:01 · 891 阅读 · 0 评论 -
使用Python进行用户漏斗分析
例如,在电子商务网站上,一个简单的漏斗可能包括以下几个阶段:访问首页 -> 浏览商品 -> 加入购物车 -> 完成购买。它通过追踪用户在不同阶段的行为,帮助我们了解用户在整个转化路径中的流失情况,并找出可能的优化点。stage列包含用户流的各个阶段。通过对每个阶段的用户数量进行统计和分析,我们可以了解用户在每个阶段的转化率和流失率。通过漏斗分析,我们可以更好地理解用户行为和需求,制定更有效的产品策略和营销策略,提升用户体验和转化率。因此,网站的用户漏斗阶段是主页>>产品页面>>购物车>>结帐>>购买。原创 2023-12-12 16:58:46 · 360 阅读 · 0 评论 -
Python进行多维数据分析
多维数据分析是对数据的信息分析,它考虑了许多关系。让我们来介绍一些使用Python分析多维/多变量数据的基本技术。从这里找到用于说明的数据的链接。以下代码用于从zoo_data. csv读取2D表格数据。输出**注意:**我们这里的数据类型通常是分类的。本案例研究中使用的分类数据分析技术是非常基本的,易于理解,解释和实施。这些方法包括聚类分析、相关分析、PCA(主成分分析)和EDA(探索性数据分析)。原创 2023-11-11 16:56:27 · 148 阅读 · 0 评论 -
使用Python进行iPhone销售分析
以上就是如何使用Python进行在印度的iPhone销售分析情况。苹果iPhone 8 Plus(金色,64GB)是印度最受欢迎的iPhone价格较低的iPhone在印度销量更高折扣高的iPhone在印度销售更多。原创 2023-10-18 18:13:48 · 230 阅读 · 0 评论 -
使用Python进行钻石价格分析
因此,这就是如何使用Python进行钻石价格分析和预测的任务。根据钻石价格分析,我们可以说优质钻石的价格和尺寸都高于其他类型的钻石。原创 2023-10-14 18:41:56 · 730 阅读 · 0 评论 -
使用Python进行App用户细分
这就是你如何根据用户与App的互动方式来细分用户。App用户细分可以帮助企业找到留存用户,找到营销活动的用户细分,并解决许多其他需要基于相似特征搜索用户的业务问题。以上是使用Python进行App用户细分的任务。原创 2023-09-30 17:44:18 · 144 阅读 · 0 评论 -
使用Python进行员工流失分析
员工流失分析是一种行为分析,我们研究离开公司的员工的行为和特征,并将其特征与现有员工进行比较,以找到即将离开公司的员工。原创 2023-09-25 18:30:39 · 422 阅读 · 0 评论 -
使用Python进行商店销售和利润分析
商店销售和利润分析可帮助企业确定需要改进的领域,并做出数据驱动的决策,以优化其运营、定价、营销和库存管理策略,从而推动收入和增长。以上是使用Python进行商店销售和利润分析的实践案例。原创 2023-09-22 19:09:39 · 310 阅读 · 0 评论 -
使用Python进行供应链分析
供应链分析是指分析供应链的各个组成部分,以了解如何提高供应链的有效性,为客户创造更多价值。以上是使用Python进行供应链分析的一个实践案例。原创 2023-09-21 20:26:33 · 351 阅读 · 0 评论 -
使用Python进行健身手表数据分析
这就是如何使用Python进行健身数据分析。Fitness Watch数据分析是健康和保健领域企业的重要工具。通过分析健身可穿戴设备的用户数据,公司可以了解用户行为,提供个性化的解决方案,并有助于改善用户的整体健康和福祉。原创 2023-09-20 17:18:28 · 137 阅读 · 0 评论 -
使用Python进行RFM分析
RFM分析是数据科学专业人员使用的一个概念,特别是在营销领域,用于根据客户的购买行为来理解和细分客户。Recency(他们最后一次购买的日期)Frequency(购买的频率)Monetary(购买的金额)这是提供有关客户参与度、忠诚度和对企业价值的信息的三个关键指标。要使用Python执行RFM分析,我们需要一个包含客户ID、购买日期和交易金额的数据集。有了这些信息,我们可以计算每个客户的RFM值,并分析他们的模式和行为。RFM分析用于根据客户的购买行为来了解和细分客户。原创 2023-09-19 17:11:26 · 413 阅读 · 0 评论 -
使用Pandas处理Excel文件
Excel工作表是非常本能和用户友好的,这使得它们非常适合操作大型数据集,即使是技术人员也不例外。如果您正在寻找学习使用Python在Excel文件中操作和自动化内容的地方,请不要再找了。你来对地方了。在本文中,您将学习如何使用Pandas来处理Excel电子表格。原创 2023-08-19 15:50:26 · 3747 阅读 · 0 评论 -
Pandas 和 CSV文件读取导出小纪
Pandas 和 CSV文件读取导出小纪原创 2023-07-13 13:06:46 · 588 阅读 · 0 评论 -
在Pandas中处理缺失数据
在Pandas中处理缺失数据原创 2023-07-11 19:19:27 · 2194 阅读 · 0 评论 -
scikit-learn实现近邻算法分类的示例
python数据挖掘入门与实践 第二章代码笔记原创 2023-02-27 15:58:17 · 332 阅读 · 0 评论 -
数据挖掘流程简单示例10min
数据挖掘流程简单示例10min Python数据挖掘入门与实践 第一章笔记原创 2023-02-22 15:02:57 · 381 阅读 · 0 评论 -
Python 实现将 Excel 数据绘制成精美图像
本课程实现使用 Python 从 Excel 读取数据,并使用 Matplotlib 绘制成二维图像。原创 2023-02-08 14:08:59 · 3157 阅读 · 0 评论 -
人口统计数据分析-python数据分析
https://chinese.freecodecamp.org/learn/data-analysis-with-python/data-analysis-with-python-projects/demographic-data-analyzer人口统计数据分析器 项目原创 2021-12-02 11:39:49 · 746 阅读 · 0 评论 -
pycaret实现CTG分类案例
import numpy as npimport pandas as pdimport warningswarnings.filterwarnings("ignore")# 读取CTG文件df = pd.read_csv('CTG.csv')df.head()# 预处理 去掉不需要的列和空值df=df.drop(["FileName","Date","SegFile","b","e"],axis=1).dropna()# 导入pycaret包的分类from pycaret.cla原创 2021-08-19 09:17:01 · 269 阅读 · 0 评论 -
catboost 学习案例
from catboost.datasets import titanicimport numpy as nptrain_df, test_df = titanic()train_df.head()原创 2021-04-14 16:56:39 · 1478 阅读 · 0 评论 -
numpy基础(1)
import numpy as np# 查看版本np.__version__使用np的函数#一维test = np.array([1,2,3,4,5])print(test)# 多维度test1 = np.array([[1,2,3],[4,5,6]])(test1)np.ones([3,3])# array([[1., 1., 1.], [1., 1., 1.],...原创 2018-06-13 17:56:38 · 204 阅读 · 0 评论 -
pandas层次化索引
创建多层行索引#1,隐式构造# 给DataFrame构造函数的index参数传递两个或更多的数组import numpy as npimport pandas as pdfrom pandas import Series, DataFrame#利用Series创建多层索引data = np.random.randint(0,100,size=8)index = [['7月','7月',...原创 2018-06-21 16:56:48 · 531 阅读 · 0 评论 -
python数据分析--分析苹果股票案例
#导包import numpy as npimport pandas as pdfrom pandas import Series, DataFrametable = pd.read_csv('AAPL.csv')table.head()#将Date 这行数据转化为时间数据类型#pd.to_datetime(Series对象)table['Date'] = pd.to_datetime(...原创 2018-06-21 17:03:31 · 1565 阅读 · 0 评论 -
python-数据分析--案例分析:美国各州人口数据分析
目标:找到美国人口密度最大的5个州import numpy as npimport pandas as pdfrom pandas import Series, DataFrame#首先导入文件,并查看数据样本s_abb = pd.read_csv('data/state-abbrevs.csv')s_abb.head()s_pop = pd.read_csv('data/state-po...原创 2018-06-21 17:07:09 · 4659 阅读 · 1 评论 -
numpy基础(2)
#创建多维数组import numpy as npm = np.array([np.arange(2), np.arange(2)])m#数组的切片和索引a = np.arange(9)aa[3:7]a[:7:2]#改变数组的维度#ravel函数可以完成展平操作b = np.arange(24).reshape(2,3,4)ba = b.ravel()aa.shap...原创 2018-06-14 20:12:36 · 131 阅读 · 0 评论 -
numpy基础(3)
#副本#可以使用copy()函数创建副本import numpy as nparr = np.random.randint(0,10,10)arr#修改元素的值arr[0] = 50arrcopy_arr = arr.copy()copy_arr#ndarray的聚合操作#求和np.sumn1 = np.arange(10)np.sum(n1)n2 = np.random....原创 2018-06-14 20:19:42 · 242 阅读 · 0 评论 -
Pandas的数据结构--Series
Series是一种类似于一维数组的对象,由以下两部分组成:values:一组数据index:相关的数据索引标签Series的创建由列表或numpy数组创建 默认索引为0到n-1的整数型索引import pandas as pdimport numpy as npfrom pandas import Series,DataFrames1 = Series([1,2,3,4,5])s1...原创 2018-06-15 11:28:34 · 536 阅读 · 0 评论 -
Pandas的数据结构--DataFrame
# DataFrame 是一个表格型数据结构,可以看做是由Series组成的字典# DataFrame 是按一定顺序排列的多项数据组成的,# 设计的初衷是为了将Series的使用场景从一维拓展到多维,所有DataFrame既有行索引,又有列索引# 行索引:index# 列索引:columns# 值:values(numpy中的二维数组)import numpy as npimport panda...原创 2018-06-17 10:00:39 · 486 阅读 · 0 评论 -
pandas处理丢失数据
#有两种丢失数据的方式:# None# np.nan(NaN) #1, None# None是python当中自带的,类型为python object,# 所以,None是不能参与到任何的计算当中的#2, np.nan#np.nan是浮点类型,能参与到计算当中,但是计算的结果为NaN#pandas中None与np.nan都被视为np.nanimport numpy as npimp...原创 2018-06-18 15:57:41 · 357 阅读 · 0 评论