数据挖掘
sty945
这个作者很懒,什么都没留下…
展开
-
如何学习数据挖掘和数据科学的7个步骤
前言概括1 学习语言2 工具:数据挖掘,数据科学和可视化软件3 教科书4 教育:网络研讨会,课程,证书和学位5 数据6 比赛7 互动:会议,团体和社交网络more前言最近一直一再学习数据挖掘的相关知识,这是一篇国外的文章,我添加了自己的一些理解,大概的翻译过来,供大家一起学习参考。概括语言:学习R,Python和SQL 工具:了解如何使用数据挖掘...原创 2018-04-06 11:29:43 · 8612 阅读 · 0 评论 -
关于某日访问次数最多的IP的topK问题的三种解法
题目描述在july大神的博客中,看到这样两道题:1. 海量日志数据,提取出某日访问百度次数最多的那个IP。2. 假设目前有一千万个记录(这些查询串的重复度比较高,虽然总数是1千万,但如果除去重复后,不超过3百万个。一个查询串的重复度越高,说明查询它的用户越多,也就是越热门。),请你统计最热门的10个查询串,要求使用的内存不能超过1G。现在我将两题结合一下:假如有1千万+的...原创 2018-08-19 20:32:01 · 7560 阅读 · 1 评论 -
网络安全相关咨询(值得收藏)
1、2019年人工智能行业的25大趋势关键词:网络;算法;开源网址:https://mp.weixin.qq.com/s/G6t9tmjejaU4rymiRgX5SQ摘要:知名创投研究机构CB Insights调研了25种最大的AI趋势,以确定2019年该技术的下一步趋势,他们根据行业采用率和市场优势评估了各种趋势,并将其归类为必要、实验性、威胁性、暂时的。信息来源:信息化协同专委会发...原创 2019-03-13 16:31:25 · 5640 阅读 · 0 评论