吴生数据分析-CSDN博客

原创 WHJ工赛NUMBER1

工业网联

2022-08-18 11:19:17 113 1

原创 pandas怎么去除去除重复行？drop_duplicates去除DataFrame表结构重复行。

微信：wusheng9922DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)subset : column label or sequence of labels, optional用来指定特定的列，默认所有列keep : {‘first’, ‘last’, False}, 默认 ‘first’删除重复项并保留第一次出现的项inplace :布尔值，默认为False，是否直接在原数据上删除重复项或删除重复

2020-09-09 18:07:30 777

原创怎么跳过异常继续执行？—python的try和except语句

微信：wusheng9922通常会遇到写了一个循环，但循环中可能出现跟代码逻辑不符合的个性情况，针对这种少数的个例，我们想跳过，继续执行下面的操作，这里我们用到 Try 和 except 语句。try: ##'有可能出现异常的代码放在这里'except: ##'当try中的代码出错时，执行这里的代码，代码写在这里'当上面的例子中，添加了 try和except 语句后，就跑出结果了。如果你需要什么都不执行可以添加空语句 pass 和 continue：try: ##'有可能出

2020-09-09 14:04:02 22362 1

原创 pandas 表与表怎么拼接？

联系微信：wusheng9922pd.concat([df1, df2], axis=0, join=‘outer’, sort=False)axis=0 默认是纵向拼接 , axis=1横向拼接。join默认连接方式是外连接, 当然还有inner内连接。注意这里没有左连接和右连接。sort=False只是消除警告而已表1表2pd.concat([df1,df2],axis=1) 形成：...

2020-08-19 14:08:12 257

原创 pandas 怎么分列一列数据？

联系微信：wusheng9922工作中经常遇到 DataFrame结构一列数据存了多个字段，或者想要去除开头结尾与业务无关的字符，形如：以此为例我们提取出 Product ID后边的四位数字单独成一列，还是有很多细节所以本文介绍一下。1将表格df2内数据转换成字符串格式df3=df2.astype(str) 此时已经转换新的表已经赋值给df3整体结构仍是DataFrame，每个字段内的数据都已经通过 astype（str）转换成了字符串。2提取产品列用str.sp

2020-08-19 13:56:01 4008

原创 python 数据分析前通常导哪些包？

联系微信：wusheng9922欢迎留言，增加你的设置，共同丰富和更新。import numpy as np import pandas as pdimport datetime as dtimport reimport timeimport matplotlib.pyplot as pltimport osimport datetime as dtplt.style.use("seaborn") # matplotlib指定样式 plt.rcParams['font.sans-

2020-08-19 09:59:25 200

原创 python中os文件路径常用操作

联系微信：wusheng9922大家常用的一般这样：1.先导包import os2.找到自己想要操作的文件夹3.改变当前工作目录到指定的路径os.chdir(r'D:\文件\用户画像')这里注意路径的引号和r转义字符4.读取这个路径下的文件pd.read_csv('orders-2020-08-12.csv')如果需要更多详细的其他操作可参考查阅：https://www.runoob.com/python/os-file-methods.html...

2020-08-19 09:51:58 194

原创怎么用python电商文本挖掘？(5)

以驱虫市场数据为例，挖掘某店铺新的业务方向和市场增长点。联系微信wusheng9922接上一节（4）接下来看市场的舆情情况分析。11 舆情分析读数据：定义文件路径os.chdir('..')os.chdir('./评论舆情数据')用glob把里面文件名都拿到并赋值给filenames5filenames5 = glob.glob('*.xlsx')filenames5读取其中的bai的数据df6bai = pd.read_excel(filenames5[1])df6bai..

2020-07-09 22:31:27 441

原创怎么用python电商文本挖掘？(4)

以驱虫市场数据为例，挖掘某店铺新的业务方向和市场增长点。联系微信wusheng9922接上一节（3）接下来看市场的竞争情况分析。10.竞争分析导入数据os.chdir('..')os.chdir('./竞争数据')10.1品类分布分析导入数据洗数据os.chdir('./商品销售数据')filenames2 = glob.glob('*.xlsx')filenames2df3 = pd.read_excel(filenames2[1])df3.head(1)def load.

2020-07-09 17:43:57 463

原创怎么用python电商文本挖掘？(3)

以驱虫市场数据为例，挖掘某店铺新的业务方向和市场增长点。联系微信wusheng9922接上一节（2）灭鼠这个产品类别是好的选择，那么细分来看灭鼠产品什么属性比较受市场欢迎。7.子类别 - 灭鼠分析选择灭鼠数据对其价格进行描述统计现准备找到销量比较好的价格区间分箱化操作根据业务逻辑自定义区间分箱化处理bins = [0,50,100,150,200,250,300,500]labels = ['0-50','50-100','100-150','150-200','20.

2020-07-09 14:48:24 320

原创怎么用python电商文本挖掘？(2)

以驱虫市场数据为例，挖掘某店铺新的业务方向和市场增长点。联系微信wusheng9922这是上一节（1）中最终得到的可用的完整数据。4.分析整个市场的总体趋势为求整体市场，对行求和，并提取时间中的年份。新增了colsums和year两列。按照年分组求和固定代码处理字体，可以不用管。plt.rcParams['font.sans-serif']='simhei'plt.rcParams['axes.unicode_minus']=False看趋势画折线图# replot表示描述相关.

2020-07-06 17:52:55 578

原创怎样用python进行数据清洗？(下)

微信 wusheng9922 欢迎交流!这里我们用某招聘网的案例来过一遍用python进行数据清洗的流程。接（1）10 去掉公司地点的中括号定义一个函数来去掉记录两端的符号再传入 .map函数中去，再赋值给原来的公司地点。def strip_gsdd(x): return x.strip('[]')df.公司地点.map(strip_gsdd)df['公司地点']=df.公司地点.map(strip_gsdd)11 把字段名工位要求改为公司要求df.rename(col.

2020-06-20 23:18:30 1882

原创怎么查询电商产品Mysql数据库？

微信：wusheng9922 欢迎交流及时响应！这是某个电商平台服装产品的数据库查询，仅提供给大家一个框架思路，数据没有上传。一、了解熟悉商品的表结构信息简单浏览下，后边看代码时遇见哪个字段不理解来这些表上查一下。为的是理解业务。用户主表： UserInfo 字段名字段描述数据类型主键外键非空唯一自增初始值 userid 用户ID ..........

2020-06-06 19:10:03 1393

wusheng9922的博客