Python实现商品销量预测(二)

数据读入及预处理

在上一篇文章中,我在寻找数据预处理的方式,粗略看了一下,感觉有点复杂。。转念一想,我要处理的数据量并不算大,也就1000多条,要不我直接手动筛选好了orz。。

我手动筛选了一下,去掉了日期无效的条目,因为要进行预测,日期是必要的项目。

下一步是结合代码选择处理方式,我所选择的代码是对txt文本进行处理,那么为了方便以及避免后续可能出现的问题,我先把xlsx处理成与之相对应的txt格式吧。

python快速将excel文件转化为txt文件_python xlsx转txt_烟雨风渡的博客-CSDN博客

感觉里面写得不够细,我想知道怎么提取特定的列。

最新Pandas.read_excel()全参数详解(案例实操,如何利用python导入excel) - 知乎

df = pd.read_excel('data_preprocess.xlsx', header=0)

 ok,现在得到我需要的两列数据了,之后得把他转成txt。

df.to_csv('data3.txt', header=None, sep=' ', index=False)

 啊这,数据日期和销量是反的,这是因为格式不一样。

那我再修改一下数据集吧

至此,数据集的读入和预处理基本完成。

 数据建模及模型评估

这一部分的代码,我看不懂TAT,就直接保留吧。

我注意到它生成的数据集是289条,而我们处理过后的数据集有1073条,所以源码中有部分数据需要修改。

试运行

还是出bug了。。

 ValueError: invalid literal for int() with base 10:解决方法_伶俐虫虫的博客-CSDN博客

用这上面的方法出现了新的报错,打个断点看看吧。

 

 这段数据后面的换行符,导致的错误。为啥这里会出错呢orz

 我重新更换了断点,再检查了一遍,终于抓到你了,原来是2022.5.13的数据有问题。

这里有两个空数据,之前预处理时被我漏掉了,把他们删掉吧。

ok,这个问题解决了。因为删除了两条数据,所以前面设置的数据集数目也要调整,现在是1072。

 程序运行成功了。但是。。

 这图片怎么这么奇怪orz。。

在经过对比,排查以后,终于发现问题在哪了。

pyl.ylim(10, 100)

 y轴的取值范围错了。

重新调了一下,果然ok了。

至此,商品销量预测基本完成。

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
【为什么学习这门课程】 人工智能课最怕听不懂、太枯燥、全是理论学完了不会用!本门课程以生活案例驱动知识讲解,手把手实战带你掌握AI工具,兼顾不同基础的学员,为你学习机器学习扫除障。 赵老师在对比国内外各类人工智能课程后,结合不同行业技术落地应用经验,从内容安排、知识点讲解、案例选择、学习资料等模块对课程进行设计与优化,致力于打造一门人工智能学习的必修课。 通过本门课程,同学将全面了解机器学习,掌握其核心技术并实现综合能力提升。    1、对于没有太多计算机基础或工科基础的同学,你将懂得如何使用AI这个强大的工具,并将其赋能于生活和工作中解决实际问题、实现升职加薪;    2、对于就读相关专业的同学,老师将帮你梳理知识点、构建知识体系,并为你的毕业设计提供指导建议;    3、对于从事相关行业工作的同学,老师还将与你探讨综合实战项目开发要点,让你的模型表现更出色! 【讲师介绍】 赵辛 人工智能算法科学家、福布斯中国科技榜U30(CSDN唯一一位)、澳大利亚新南威尔士大学全奖博士 【课程特色】1、课程设计:课程中涉及到的项目全部源自生活案例,内容全面、易懂,采用现实案例+知识干货+手把手实战的方式,实现人工智能的知识入门与综合提升;2、知识层面:覆盖主流技术,侧重技术应用与核心原理,易于理解;3、案例丰富:知识讲解部分基于现实案例,实现与生活紧密结合;实战部分案例亦从生活出发,区别于市场上用烂了的相似案例;4、配套资料:学员专享,老师专门整理了丰富的学习资料,并且会长期更新5、名师讲解:讲师为福布斯中国2019年科技榜U30上榜者(CSDN唯一一位))  【手把手带你实战,实战项目全部源自生活案例】 【带你了解课程的整个知识体系】 
Python淘宝商品销量是指使用Python编程语言来分析和预测淘宝商品销量情况。Python在数据分析和机器学习领域有着广泛的应用,可以帮助分析师和商家更好地理解和预测商品销售情况。 以下是使用Python进行淘宝商品销量分析的一般步骤: 1. 数据收集:使用Python编写爬虫程序,从淘宝网站上获取商品的相关数据,包括商品名称、价格、销量、评价等信息。 2. 数据清洗与预处理:使用Python的数据处理库(例如Pandas)对获取的数据进行清洗和预处理,包括去除重复数据、处理缺失值、转换数据格式等。 3. 数据可视化:使用Python的可视化库(例如Matplotlib、Seaborn)将清洗后的数据进行可视化,通过绘制折线图、柱状图等,对商品销量的趋势和特征进行分析。 4. 特征工程:根据需求和领域知识,使用Python进行特征工程,提取出对商品销量具有影响的特征,例如促销活动、店铺评分等。 5. 建立模型:使用Python的机器学习库(例如Scikit-learn、TensorFlow)建立销量预测模型,选择合适的算法(例如线性回归、决策树、随机森林等)进行训练和优化。 6. 模型评估与预测:使用Python对建立的模型进行评估,通过计算评价指标(例如均方根误差、平均绝对误差等)来衡量模型的性能,并进行商品销量预测。 需要注意的是,具体的分析方法和结果可能因数据集和问题的不同而有所差异。以上是一般的步骤,具体分析时还需要根据实际情况进行调整和优化。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值