python(数据分析与可视化)六
爬虫与数据库连接
1.估算评论情感分数
把评论数据从数据库拿出,走停止词过滤,统计出现的积极词汇和消极词汇的个数。
假定 用户满意分数:(积极词汇个数1 - 消极词汇个数5)/评论条数
comment_words = [
'品质', '、', '做工', '都', '非常', '好', ',', '发货', '贼', '快', ',', '快递', '也', '给', '力', ',', '棒棒', '哒', '~', '?', '?', '?', '不得不', '赞', ',', '质量', '真的', '好', ',', '包装', '物流', '也', '不错', '。', '真心', '喜欢', ',', '入手', '后', '不会', '让', '你', '后悔', '的', '!', '东西', '已经', '收到', '!', '手感', '不错', '!', '用料', '扎实', '!', '质量', '很', '好', '!', '平常', '用', '基本', '没有', '问题', '!', '宝贝', '心仪', '很久', '了', ',', '趁', '活动', '时候', '买', '真的', '太', '划算', '了', ',', '喜欢', '的', '不要', '犹豫', '啊', '跟', '我', '在', '实体店', '买', '的', '一模一样', '!', '还是', '一样', '的', '好', '用', ',', '开心', '总体', '来说', ',', '确实', '很', '不错', ',', '客服', '的', '服务态度', '也', '很棒', ',', '说话', '几乎', '马上', '就', '会', '回', '消息', ',', '物超所值', ',', '真心', '推荐', '宝贝', '特别', '喜欢', ',', '颜值', '高质量', '好', ',', '中看', '又', '中用', ',', '有', '需要', '的', '朋友', '不要', '犹豫', '了', '外形', '外观', ':', '改变', '最大', '的', '一款', ',', '平民', '版', '终于', '给', 'led', '屏幕', '了', '。', '\n', '屏幕', '音效', ':', '还好', ',', '一罐', '的', '苹果', '特色', '。', '\n', '拍照', '效果', ':', '对比', '之前', '用', '的', '8', ',', '提升', '较大', '。', '特别',