[跪求大神]大数据中的文本数据挖掘问题，非结构化转换问题

最新推荐文章于 2024-08-15 10:41:38 发布

小nini

最新推荐文章于 2024-08-15 10:41:38 发布

阅读量1.4k

点赞数

分类专栏：大数据文章标签：数据挖掘大数据结构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/nirong007/article/details/46006529

版权

大数据专栏收录该内容

1 篇文章 0 订阅

订阅专栏

现有一个数据包，里面有大量txt文件，txt文件里存储的是一家餐厅的基本信息，以及客户对其评价，包括的字段如下：

id：店铺id

name：店铺名

name_all：店铺全称

star：平均评价分数

address：地址

tags：标签

comment：一条评论

uid：用户id

user：用户名称

level：评分

content：评价内容

cut：分词后的评价字符串

-----------------------------------------------

样例数据：

<id>516112</id>

<name>麻辣诱惑(君太店)</name>

<name_all>麻辣诱惑</name_all>

<star>40</star>

<address>西城区西单北大街133号君太百货7楼</address>

<tags>川菜西单</tags>

<comment>

<uid>7068723</uid>

<user>yanglynn</user>

<level>4</level>

<content>人太多，太多。只有水煮鱼我还能喜欢吃，别的都觉得也就是吃吃。味道还是不错的，但是没好吃的人那么多的程度吧。呵呵</content>

<cut>太多/太多/只有/有水/水煮/水煮鱼/我还/还能/喜欢/吃/别的/都/觉得/也就/就是/吃吃/味道/还是/是不/不错/不错的/没/好吃/吃的/的人/那么/那么多/多的/程度/呵呵</cut>

</comment>

现在的目的有2个：（1）需要把这些非结构化数据尽量转化成可分析的结构化数据（2）需要对评论内容content进行数据挖掘，比如能挖出客户对餐厅环境、菜品、服务态度等方面的评价。

对数据挖掘，非结构数据转换等方面感兴趣的，或者熟悉此类操作的大神们，跪求帮助啊！！！！！！希望能提供一点点解决思路，或者是所需要的软件硬件技术，也可以是部分代码，有多少帮助都可以！！！！经济统计学要迈入大数据的行列，门槛很高么？？小白我决定试一试，求各路大神支招，跪谢！！！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

小nini CSDN认证博客专家 CSDN认证企业博客

码龄12年

1: 原创

83万+: 周排名

206万+: 总排名

1419: 访问

: 等级

24: 积分

1: 粉丝

0: 获赞

0: 评论

0: 收藏

私信

关注

热门文章

[跪求大神]大数据中的文本数据挖掘问题，非结构化转换问题 1420

分类专栏

大数据 1篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。