自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(28)
  • 收藏
  • 关注

原创 astype(char)!?

类型(在Python 3中,所有字符都是字符串的一部分),而是用于数值类型(如int, float)与字符串类型(str)或日期时间类型(datetime64等)之间的转换。它并不直接用于字符(char)和字符串(str)之间的转换,因为Python本身并没有单独的。方法主要用于Pandas库中的DataFrame或Series对象,用于更改数据的数据类型。

2024-07-08 00:00:06 76

原创 环比和同比

环比注重观察短期内的变化,同比则更关注长期趋势。环比和同比都是重要的分析工具,可以帮助我们更全面地了解某一现象的发展情况。在实际应用中,我们可以根据具体需求选择合适的比较方式。

2024-06-22 17:41:12 228

原创 ROI投资回报率

ROI,全称Return on Investment,意为投资回报率。它是指通过投资而应返回的价值,即企业从一项投资活动中得到的经济回报。在电商领域,ROI主要用来衡量电商业务的盈利能力和投资效果。

2024-06-21 17:26:03 260

原创 GMV与销售额

假设在某电商平台上,A商品的价格为100元,运费为10元,B商品的价格为200元,运费为5元。在一天内,平台上有10笔A商品的交易和5笔B商品的交易。总之,GMV是电商平台上的一个重要指标,用于衡量平台的交易活跃度和规模。然而,与销售额相比,GMV在计算方式、反映层次、风险程度和用途上都有所不同。它是指在一定时间内,电商平台上所有交易的总金额,包括商品价格和运费等。GMV是电商平台的重要指标之一,用于反映平台的交易活跃度和规模。销售额是指实际完成的交易金额,即顾客实际付款并确认收货的金额。

2024-06-21 17:13:53 1075

转载 电商术语PV、UV、GMV和转化率

如图,以下为2020年淘宝直播,抖音,快手直播电商平台的GMV。数据显示,淘宝直播、抖音及快手2020年的电商GMV都超过了目标值,其中淘宝直播GMV超过4000亿元,抖音电商全年商品成交总额超5000亿元,增幅约为2019年的三倍。艾媒咨询分析师认为,随着移动互联网渗透率的提升,医药网站的访问量下降,因此,不少医药网站也推出了医药App进行运营。在SEO优化中,UV是一个数据指标,即在给定的时间范围内访问您网站上的一个页面或多个页面的访客数量,不管他们访问这些页面的频率如何。

2024-06-21 16:03:46 193

原创 新手:熟悉Access基础操作

复制行,粘贴时只能在最后一行粘贴,否则数据将会被覆盖。在excel中可以每行设置得不一样高度,而access中行高都是统一高度的。默认的enter是下一个字段,可以在文件-选项中修改。同时,access中数据表的外观也可以在选项中修改。汇总时,文本只能计数。数字,可以求各种统计值。在查找替换筛选时都可以用到。修改列宽:右键-字段宽度。查找范围:当前字段/全部。修改行高:右键-行高。只能冻结列,不能冻结行。搜索:向上/向下/全部。* 表示一个或多个字符。可以详细设置字段类型。表视图:可以输入数据。

2024-06-20 23:29:09 236

原创 关系模式的规范化(关系数据库规范化理论)

有一个关系模式S(A,B,C),其中,A->B,B->C。自然连接操作能够恢复出原来的关系模式。

2024-06-20 21:11:07 218

原创 描述性统计量

这类描述性数字的好处在于,它们描述了某个具体的值在于其他数据进行比较时所处的位置。

2024-06-20 20:26:51 426

原创 范式(关系数据库规范化理论)

1.数据库的范式是关系型数据库设计时的一套规范,用于指导如何设计合理的关系型数据库。3.范式关系:如果一个关系满足BCNF,那么它也一定满足3NF、2NF和1NF;如果一个关系满足3NF,那么它也一定满足2NF和1NF,以此类推。

2024-06-20 20:16:27 331

原创 数据依赖(关系数据库规范化理论)

即应该构造几个关系,每个关系由哪些属性组成等关系数据库的规范化理论关系模式是。关系模式由五个部分组成。R(U,D,DOM,F)————>一般表示为R:关系名D:属性来自的域DOM:属性向域的映像的集合。

2024-06-20 00:23:41 568

原创 数据库设计步骤

数据库设计是一个系统而复杂的过程,旨在构造最优的数据库模式,以满足用户的信息要求和处理要求。

2024-06-19 17:41:18 321

原创 关系数据模型

如果一个关系R中的一个属性F对应着另一个关系S的一个主属性K,那么F在关系R中称为外码说明关系R和S不一定是不同的关系被参照关系S的主码K和参照关系的外码F必须定义在同一个域上外码并不一定要与相应的主码同名当外码与相应的竹马属于不同关系时,往往取相同的名字以便于识别参照完整性规则就是定义外码与主码之间的引用规则参照完整性规则取空值,或者等于被参照表中某个元组的主码值外码可以取空值是针对某一具体关系数据库的约束条件反映某一具体应用所涉及的数据必须满足的语义要求。

2024-06-19 16:47:01 364

原创 数据库系统的体系结构

外部模型,逻辑模型,内部模型这三个层次要用DB的数据定义语言(DDL)定义,定义以后的内容,称为“模式”/(模式又叫模型三层模式有两级映像:分别是:外模式/逻辑模式映像,逻辑模式/内模式映像,映像就像一个接口,存储对应关系。

2024-06-19 03:09:49 325

原创 数据库原理之基础概念

信息是客观存在的,是关于现实世界事务的存在方式或运动状态反映的综合:数据是用来记录信息的可识别的符号,是信息的具体表现形式:(DB)是长期储存在计算机内,有组织,可共享的数据集合(有组织:二维表)冗余度低数据独立性高:(DBMS)是位于用户与操作系统之间的一层数据管理软件(通俗地说:对数据库中的数据进行管理,科学地组织和存储数据,高效地获取和维护数据)数据定义语言数据操纵语言保证数据的安全性,整体性。

2024-06-19 02:48:44 269

原创 输出的pandas DataFrame不对齐怎么办?

如果你之前更改了Pandas的显示设置,并且不确定哪些设置导致了问题,你可以尝试将设置重置为默认状态。将DataFrame转换为HTML或LaTeX格式,并将其嵌入到你的报告或文档中。方法提供了许多参数,允许你定制生成的HTML表格的外观和行为。

2024-06-17 00:00:01 220

原创 数组,向量,矩阵,张量之间的区别与联系

一组有序排列的数,既有大小也有方向由多个行和列组成一个多维数据容器,可以用来表示各种数据类型,如数值、图像、音频、文本等线性表数据结构,它用一组连续的内存空间来存储一组具有相同类型的数据。

2024-06-10 16:04:27 333

原创 Python 数据分析与可视化(上)

默认情况下,当你创建一个新的DataFrame时,Pandas会自动为你分配行索引和列索引。但是,你也可以在创建时或之后自定义这些索引。2.1定义列索引:列索引是DataFrame中列的名称。在创建DataFrame时,你可以通过传递一个字典(其中键是列名,值是列的数据)或一个包含列名的列表来定义列索引。data = {print(df)A B C0 1 4 71 2 5 82 3 6 92.2定义行索引:行索引是DataFrame中行的标签。默认情况下,当你创建一个新的DataFrame。

2024-06-07 16:59:37 898

原创 使用到的os库的相关函数

模块的函数,用于列出指定目录下的所有文件和子目录的名称。目录下的所有文件和子目录的名称。

2024-06-05 16:35:10 208

原创 Python里一些还不清楚的知识点

是一个格式化字符串字面量。它是从Python 3.6开始引入的一种新的字符串格式化方法。在f-string中,你可以嵌入任何有效的Python表达式。

2024-06-05 15:55:34 128

原创 C盘没有空间剩余,怎么办?

毕业设计还没搞完,C盘爆了,告诉大家一个绝佳的好方法o(* ̄▽ ̄*)ブ。等待电脑重启就OK啦。

2024-05-12 19:36:55 91

原创 tokenizer():分词函数

输入了一段文本,输出了一个分词后的列表。

2024-05-12 17:20:33 156

原创 元组(简单)

Python 的元组与列表类似,不同之处在于元组的元素不能修改。元组使用小括号,列表使用方括号。元组创建很简单,只需要在括号中添加元素,并使用逗号隔开即可。

2024-05-12 16:56:43 179 1

原创 get_stop_words():构建停用词列表

在文本处理过程中,被忽略或删除的词汇。这些词汇通常是频繁出现的无实际意义的词语,例如介词、连词、冠词、代词。删去文本中的停用词,可以在训练时节省大量的存储空间和计算资源。

2024-05-12 13:48:06 154

原创 word for word in jieba.cut(text) if word.strip()

这句代码:使用jieba.cut()函数对text进行分割,生成一个可迭代对象。使用for循环对可迭代对象进行遍历,输出每一个不为空的值。对text这个文本对象进行处理,生成一个可迭代的数据类型。一般通过遍历或者list[]显示出来。word为迭代变量,jieba.cut()为迭代对象,进行if判断,最后输出word。:用来删去字符串头尾指定的字符,默认删去空白和换行符。

2024-05-10 20:49:08 142

原创 什么是正则表达式?(简单介绍)

正则表达式:用来匹配相应的文本。修饰符写在表达式的外面。

2024-05-10 16:24:26 166

原创 获取文件路径:os.path.abspath/dirname

os.path

2024-05-10 14:40:03 159

原创 如何在jupyter里导入torchtext

我的torch版本是2.3.0 python版本是3.11.7。重要:torchtext要和pytorch,python的版本对应。所以安装了torch text最新版0.18.0。在jupyter里运行成功!打开anaconda prompt。这个表可以自己在官网找。

2024-05-09 16:05:52 163

原创 jupyter安装torch遇到的问题

6.重新打开anaconda prompt,输入conda install nb_conda。7.进入pytorch环境,输入conda install ipykernel。5.安装成功,输入python,输入import torch。在jupyter里直接pip install torch,于是,换条路,到anaconda prompt里操作。pytorch环境不在anaconda文件夹下。环境得选pytorch,不然还是有问题。1.先创建pytorch环境。2.查看当前已经有的环境。

2024-05-09 15:14:13 315

Excel制作报表的常用函数

Excel制作报表的常用函数

2024-06-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除