数据分析1.1

商品评论分析1

1.背景与挖掘目标
随着网上购物越来越流行,人们对于网上购物的需求变得越来越高,这让很多店商平台得以崛起,引发的激烈的竞争,除了商品质量的提高,压低商品价格外,了解更多的消费者心声对于其他将要购买产品的人或店商平台来说,变得越来越有必要了,其中重要的方式是对消费者的评论文本进行挖掘分析.

对京东平台上的手机评论进行文本挖掘分析
1)分析一品牌手机的用户情感分析
2)从评论文本中挖掘出该品牌手机的优点与不足

2分析方法

本次针对京东一品牌手机的消费者的文本评论数据进行分析.对文本进行基本的机器预处理,中文分词,停用词过滤(这里我采用词性过滤),通过建立栈式自编码深度学习,情感倾向模型(这里我直接爬取的是好评,差评,中评,没有通过基于情感倾向模型和转化为机器学习问题)k-means聚类,LDA主题模型分析,实现对文本评论数据的倾向性判断以及所隐藏的信息的挖掘并分析.

  1. 代码实现

1)数据获取

用浏览器浏览到商品评论页,右键点击检查元素,获取该页面请求的url即可,京东,淘宝等店商平台对爬取评论信息基本没有反爬措施.好像只能爬取前100页的评论(有什么能获取更多评论的方法请告诉博主,博主将不胜感激!!!)

代码清单如下:

import requests
import json
import re
import time
import pandas as pda

def main():
    bed_outfile = '输出地址\\bed_pl.csv'
    good_outfile = '输出地址\\good_pl.csv'
    con_outfile = '输出地址\\con_pl.csv'
    for i in range(1,4):
        if i==1:
            indx_page(i,bed_outfile,85)
        elif i==2:
            indx_page(i, con_outfile, 70)
        else:
            indx_page(i, good_outfile, 95)


def indx_page(i,file,m):
    sp_data = {'评论': '', '日期': '', '会员': '', '追评': '无', '追评日期': '无'}
    head = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'
    }
    for j in range(m):
        url = 'https://sclub.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98vv25770&productId=6946625&score=&#
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 要下载hwdb1.1数据集,首先要确保你有一个可以访问互联网的设备,比如计算机或手机。接下来,你需要打开一个适用于数据下载的网站,比如Github或Kaggle。 在网站的搜索栏中输入"hwdb1.1数据集",然后按下"Enter"键进行搜索。你会得到一些相关的搜索结果。请仔细查看每个搜索结果的描述,找到一个可靠的来源。 点击合适的链接,你会被带到一个数据集的页面。在这个页面上,你将看到一些关于数据集的详细信息,比如创建者、大小和格式等。 确认数据集满足你的需求后,你可以寻找一个下载按钮或链接。点击下载按钮会弹出一个文件下载的对话框。请选择一个存储位置,并保存文件。 当下载完成后,你可以在你选择的存储位置中找到下载的文件。可能是一个压缩文件,你需要将其解压缩。 完成解压缩后,你就可以开始使用hwdb1.1数据集了。根据你的具体需求,你可以使用不同的工具和编程语言对数据集进行处理和分析。 总结来说,下载hwdb1.1数据集需要以下步骤:搜索数据集 -> 选择可靠的源 -> 确认信息 -> 下载文件 -> 解压缩文件 -> 使用数据集。希望这个回答对你有所帮助! ### 回答2: hwdb1.1是一个中文手写汉字数据集,可以用于机器学习和计算机视觉的研究。下面是关于hwdb1.1数据集的下载方式: 1. 首先,打开网页浏览器,访问“http://www.nlpr.ia.ac.cn/databases/handwriting/Home.html”。 2. 在该网页中,找到“Download”或“数据下载”等类似的标签,点击进入数据集下载页面。 3. 在数据集下载页面中,你可以看到hwdb1.1数据集的介绍和具体下载链接。 4. 根据你的需要,选择合适的下载方式。通常,你可以选择直接下载整个数据集的压缩包或者分部分下载。 5. 点击下载链接后,等待下载完成。下载时间可能会根据你的网络速度和数据集大小的不同而有所变化。 6. 下载完成后,解压缩得到的文件。通常,你会得到一个包含多个子文件夹和文件的文件夹。 7. 在解压缩后的文件夹中,你可以找到hwdb1.1数据集的图像文件和对应的标签文件,这些文件将帮助你进行后续的研究和实验。 总之,要下载hwdb1.1数据集,你需要访问官方网站,找到相应的下载链接,并完成下载和解压缩过程。请注意保留好下载所需的空间,并确保你的网络连接稳定。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值