大数据
kkkkkkc1
每天进步一点点
展开
-
2020华为云大数据挑战赛Top123方案分享链接
RANK 待上传 RANK2 RANK3原创 2020-09-06 17:06:38 · 375 阅读 · 0 评论 -
2020华为大数据参赛总结
总结一下这次参加华为大数据比赛的体会和收获 此次比赛最后止步200+ 没能进复赛 第一次参加大数据竞赛 虽然没能进复赛 但总得来说 还是很值得的 初赛一个月的备赛时间 我和我的组员大约只用了半个月在比赛上 首先 比赛真的是可以长见识的 这次大数据的训练集有20GB 刚拿到数据的那一周都不知道怎么下手 最后是通过将大文件分割成若干个小文件 找到了比赛入口 通过这次比赛 我粗略地学习了python 机器学习 数据挖掘 人生苦短 我用python python的库很丰富 这次在csv文件的操作上 大量的使用了pa原创 2020-06-30 01:18:52 · 953 阅读 · 0 评论 -
机器学习 --基础入门介绍 他来啦!!!
行业热词解释 机器学习基本术语 假如我们有一组天气数据,是来自全世界不同国家和地区的每日天气,内容包括最高温度、最低温度、平均湿度、风速之类的相关数据,例如数据的一部分是这样的: 城市 最高温度 最低温度 相对湿度 某时刻风速 A市 36℃ 28℃ 58% 16.7km/h转载 2020-06-26 20:35:28 · 298 阅读 · 0 评论 -
python进行拆分大文件
python按指定行数把大文件进行拆分 如图大文件有7000多万行,大小为16G 需要拆分成多个200万行的小文件 代码如下: # -*- coding:utf-8 -*- from datetime import datetime def Main(): source_dir = '/jz_yuanshi_list0206.txt' target_dir = '/split/' # 计数器 flag = 0 # 文件名 name = 1转载 2020-06-24 23:23:39 · 3489 阅读 · 0 评论 -
#大数据#“分类”和“回归”问题的区别
其实分类和回归的本质是一样的,都是对输入做出预测,其区别在于输出的类型。 分类问题:分类问题的输出是离散型变量(如: +1、-1),是一种定性输出。(预测明天天气是阴、晴还是雨) 回归问题:回归问题的输出是连续型变量,是一种定量输出。(预测明天的温度是多少度)。 ...转载 2020-05-26 21:33:33 · 424 阅读 · 0 评论