面对繁复的数据时,怎么办

最新推荐文章于 2022-12-02 20:33:01 发布

苏小咩

最新推荐文章于 2022-12-02 20:33:01 发布

阅读量458

点赞数

分类专栏：数据处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/beiyouzidonghua/article/details/44194447

版权

数据处理专栏收录该内容

1 篇文章 0 订阅

订阅专栏

最近因为论文不得已去接触KDD2012的腾讯微博数据集,一开始是打算自己用小的数据集得到结论,结果是too young too simple.其实一开始就应该硬着头皮去对数据做简单的处理和分析,现在先说一下初步的处理.

1,选择其中一个userID作为引子,把多个文件沟通起来,建立一个新纬度的数据思考的思路

2,基本的匹配\统计是很有必要的

3,可能一个问题看起来很复杂,要学会把这些问题分布去处理,一步一步得到中间结果,这个是很有必要的.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
面对繁复的数据时,怎么办

最近因为论文不得已去接触KDD2012的腾讯微博数据集,一开始是打算自己用小的数据集得到结论,结果是too young too simple.其实一开始就应该硬着头皮去对数据做简单的处理和分析,现在先说一下初步的处理. 1,选择其中一个userID作为引子,把多个文件沟通起来,建立一个新纬度的数据思考的思路 2,基本的匹配\统计是很有必要的
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。