基于评论、新闻的情感倾向分析作商品的价格预测

最新推荐文章于 2023-07-04 14:42:42 发布

煊琰

最新推荐文章于 2023-07-04 14:42:42 发布

阅读量861

点赞数

实验环境

●  操作系统：Windows、Linux
●  语言环境：Python、MATLAB、java
●  实验工具：NLTK、sklearn、MATLAB2015b、Pycharm

● 服务器： tomcat

用开源框架Scrapy分析Xpath路径抓取中关村报价网站

上述文件中product文件夹是定制好抓取电子产品价格的数据采集器，MySQL建立数据库见文件

应用scrapy爬虫框架，定制爬虫抓取中关村报价产品的价格数据并且存储于MySQL数据库中

1.其中的过程是分析网页的Xpath路径，根据要获取的数据的路径定位到价格数据（可以分析不同的网站数据抓取）

2.存储数据打MySQL数据库中，主要是方便操作和使用

scrapy startproject tutorial

4000204f5aca9bec0d5290c1187754e63cd66c87

爬虫名字可以随意设定，同时设定采集器在服务器上能够定时采集数据这里定制bat文件。锁定域名范围为：zol.com分析URL中正则表达式如下：http://detail.zol.com.cn/cell_phone/index****.shtml

最后将采集到的数据存储到MySQL数据库中如下图：

c73899a1190fbfa33c9e6e89fb95ea2d7cf49561

如果是在Linux服务器上做该定时任务只需要按照需要编写crontab即可。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。