自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 WHJ工赛NUMBER1

工业网联

2022-08-18 11:19:17 107 1

原创 pandas怎么去除去除重复行?drop_duplicates去除DataFrame表结构重复行。

微信:wusheng9922DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)subset : column label or sequence of labels, optional用来指定特定的列,默认所有列keep : {‘first’, ‘last’, False}, 默认 ‘first’删除重复项并保留第一次出现的项inplace :布尔值,默认为False,是否直接在原数据上删除重复项或删除重复

2020-09-09 18:07:30 774

原创 怎么跳过异常继续执行?—python的try和except语句

微信:wusheng9922通常会遇到写了一个循环,但循环中 可能出现跟代码逻辑不符合的 个性情况,针对这种 少数的个例,我们想跳过,继续执行下面的操作,这里我们用到 Try 和 except 语句。try: ##'有可能出现异常的代码放在这里'except: ##'当try中的代码出错时,执行这里的代码,代码写在这里'当上面的例子中,添加了 try和except 语句后,就跑出结果了。如果你需要 什么都不执行 可以添加空语句 pass 和 continue:try: ##'有可能出

2020-09-09 14:04:02 22120 1

原创 pandas 表与表怎么拼接?

联系微信:wusheng9922pd.concat([df1, df2], axis=0, join=‘outer’, sort=False)axis=0 默认是纵向拼接 , axis=1横向拼接。join默认连接方式是外连接, 当然还有inner内连接。注意这里没有左连接和右连接。sort=False只是消除警告而已表1表2pd.concat([df1,df2],axis=1) 形成:...

2020-08-19 14:08:12 254

原创 pandas 怎么分列一列数据?

联系微信:wusheng9922工作中经常遇到 DataFrame结构 一列 数据 存了多个字段,或者 想要去除 开头结尾 与业务无关的字符,形如:以此为例 我们 提取出 Product ID后边的四位 数字 单独成一列,还是有很多细节 所以本文介绍一下。1将表格df2内数据转换成字符串格式df3=df2.astype(str) 此时已经转换新的表 已经赋值给df3整体结构仍是DataFrame,每个字段内的数据都已经通过 astype(str)转换成了 字符串。2提取产品列用str.sp

2020-08-19 13:56:01 4000

原创 python 数据分析前通常导哪些包?

联系微信:wusheng9922欢迎留言,增加你的设置,共同丰富 和 更新。import numpy as np import pandas as pdimport datetime as dtimport reimport timeimport matplotlib.pyplot as pltimport osimport datetime as dtplt.style.use("seaborn") # matplotlib指定样式 plt.rcParams['font.sans-

2020-08-19 09:59:25 194

原创 python中os文件路径常用操作

联系微信:wusheng9922大家常用的一般这样:1.先导包import os2.找到自己想要操作的文件夹3.改变当前工作目录到指定的路径os.chdir(r'D:\文件\用户画像')这里注意 路径的引号和r转义字符4.读取这个路径下的文件pd.read_csv('orders-2020-08-12.csv')如果需要更多详细的 其他操作 可参考查阅:https://www.runoob.com/python/os-file-methods.html...

2020-08-19 09:51:58 186

原创 怎么用python电商文本挖掘?(5)

以驱虫市场数据为例,挖掘某店铺新的业务方向和市场增长点。联系微信wusheng9922接上一节(4) 接下来看市场的舆情情况分析。11 舆情分析读数据:定义文件路径os.chdir('..')os.chdir('./评论舆情数据')用glob把里面文件名都拿到 并赋值给filenames5filenames5 = glob.glob('*.xlsx')filenames5读取其中的bai的数据df6bai = pd.read_excel(filenames5[1])df6bai..

2020-07-09 22:31:27 435

原创 怎么用python电商文本挖掘?(4)

以驱虫市场数据为例,挖掘某店铺新的业务方向和市场增长点。联系微信wusheng9922接上一节(3) 接下来看市场的竞争情况分析。10.竞争分析导入数据os.chdir('..')os.chdir('./竞争数据')10.1品类分布分析导入数据 洗数据os.chdir('./商品销售数据')filenames2 = glob.glob('*.xlsx')filenames2df3 = pd.read_excel(filenames2[1])df3.head(1)def load.

2020-07-09 17:43:57 459

原创 怎么用python电商文本挖掘?(3)

以驱虫市场数据为例,挖掘某店铺新的业务方向和市场增长点。联系微信wusheng9922接上一节(2) 灭鼠 这个产品类别 是好的选择,那么细分来看灭鼠产品什么属性比较受市场欢迎。7.子类别 - 灭鼠 分析选择灭鼠数据对其价格进行描述统计现准备找到 销量比较好的价格区间 分箱化操作根据业务逻辑 自定义区间 分箱化处理bins = [0,50,100,150,200,250,300,500]labels = ['0-50','50-100','100-150','150-200','20.

2020-07-09 14:48:24 316

原创 怎么用python电商文本挖掘?(2)

以驱虫市场数据为例,挖掘某店铺新的业务方向和市场增长点。联系微信wusheng9922这是上一节(1)中最终得到的可用的完整数据。4.分析整个市场的总体趋势为求整体市场,对行求和,并提取时间中的年份。新增了colsums和year两列。按照年分组求和固定代码处理字体,可以不用管。plt.rcParams['font.sans-serif']='simhei'plt.rcParams['axes.unicode_minus']=False看趋势 画折线图# replot表示描述相关.

2020-07-06 17:52:55 570

原创 怎样用python进行数据清洗?(下)

微信 wusheng9922 欢迎交流!这里我们用某招聘网的案例来 过一遍用python进行数据清洗的流程。接(1)10 去掉公司地点的中括号定义一个函数 来去掉记录两端的符号 再传入 .map函数中去,再赋值给原来的公司地点。def strip_gsdd(x): return x.strip('[]')df.公司地点.map(strip_gsdd)df['公司地点']=df.公司地点.map(strip_gsdd)11 把字段名工位要求改为公司要求df.rename(col.

2020-06-20 23:18:30 1875

原创 怎么查询电商产品Mysql数据库?

微信:wusheng9922 欢迎交流 及时响应!这是某个电商平台服装产品的数据库查询,仅提供给大家一个框架思路,数据没有上传。一、了解熟悉商品的表结构信息简单浏览下,后边看代码时 遇见哪个字段不理解 来这些表上 查一下。为的是理解业务。用户主表: UserInfo 字段名 字段描述 数据类型 主键 外键 非空 唯一 自增 初始值 userid 用户ID ..........

2020-06-06 19:10:03 1386

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除