自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 收藏
  • 关注

转载 大数据应用期末总评

作业要求来源:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3363大数据分析:  1.将爬虫大作业产生的csv文件上传到HDFS    Python爬取到的数据:            (1)首先创建一个用于运行本案例的目录bigdatacase        (2)在本地查看数据集 ...

2019-06-20 21:48:00 103

转载 分布式文件系统HDFS练习

本次作业要求:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3310利用Shell命令与HDFS进行交互以”./bin/dfs dfs”开头的Shell命令方式执行start-dfs.sh命令开启进程1.目录操作1)在HDFS中为hadoop用户创建一个用户目录(hadoop用户)2)在用...

2019-06-03 12:26:00 108

转载 安装Hadoop

本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/32231.安装Linux(1)虚拟机命名,选择操作系统,版本(2)选择内存大小(3)启动Ubuntu(4)添加镜像文件(5)开始安装Ubuntu(6)新建分区表(7)设置用户名和密码(8)用户...

2019-05-16 21:35:00 101

转载 爬虫综合大作业

本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/3159爬虫综合大作业选择一个热点或者你感兴趣的主题。选择爬取的对象与范围。了解爬取对象的限制与约束。爬取相应内容。做数据分析与文本分析。形成一篇文章,有说明、技术要点、有数据、有数据分析图形化展示与说明、文本分析图形化展示与...

2019-05-09 21:56:00 164

转载 爬取全部的校园新闻

本次作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/30020.从新闻url获取点击次数,并整理成函数newsUrlnewsId(re.search())clickUrl(str.format())requests.get(clickUrl)re.search()/.split...

2019-04-14 23:57:00 83

转载 理解爬虫原理

本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/28811. 简单说明爬虫原理程序通过模拟浏览器请求站点,把站点返回的HTML代码、JSON数据、图片视频数据爬到本地,进而提取需要的数据。2. 理解爬虫开发过程 1)浏览器工作原理用户输入URL->解析URL->网络连接...

2019-04-01 14:28:00 50

转载 中文词频统计与词云生成

本次作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2822一、中文词频统计1. 下载一长篇中文小说。2. 从文件读取待分析文本。3. 安装并使用jieba进行中文分词。pip install jiebaimport jiebajieba.lcut(text)4. 更新词库,...

2019-03-25 12:09:00 78

转载 复合数据类型,英文词频统计

本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753一、列表,元组,字典,集合分别如何增删改查及遍历1、列表•增list1=['空无之钥','雨后誓言','永暮双狼','犹大誓约','阿芙洛狄忒']print(list1)#在列表末尾添加新的对象list1.append...

2019-03-24 17:18:00 79

转载 字符串操作、文件操作,英文词频统计预处理

本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/26841.字符串操作:解析身份证号:生日、性别、出生地等。file = open('region.txt','r')text = file.read()file.close()text = text.replace('\...

2019-03-11 21:53:00 94

转载 了解大数据的特点、来源与数据呈现方式

本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/26391.这些分析所采用数据的来源是什么?(1)交易数据。各大交易平台点击、浏览、交易订单数据;(2)互联网上的“开放数据”来源。政府机构,非营利组织和企业免费提供的数据;(3)移动通信数据。移动通信设备上记录的各种数据;(4)人为数据...

2019-03-04 12:48:00 281

转载 结对项目-四则运算"软件"之升级版

本次作业要求来自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2213github地址为:https://github.com/LinsenLiang/Aika/tree/master/fourFundamentalRules一、从个人项目出发,将程序改造成一个单机带用户界面(不是控制台)的程序,这个程序最基本要...

2018-10-24 21:42:00 98

转载 第三次作业:个人项目-小学四则运算“软件”之初版

本次作业要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2166我的github远程仓库的地址:https://github.com/LinsenLiang/Aika一、题目要求:具体要求:任何编程语言都可以,命令行程序接受一个数字输入,然后输出相应数目的四则运算题目和答案。例如输入数字是 30, ...

2018-10-10 11:25:00 151

转载 分布式版本控制系统Git的安装与使用

本次作业要求来自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2103github远程仓库的地址:https://github.com/LinsenLiang/Aika1.修改并查看用户名和邮箱2.创建本地版本仓库创建一个工作目录并且通过git init命令把这个目录变成Git可以管理的仓库3...

2018-09-17 21:12:00 74

转载 第一次作业:准备

这个作业的要求来自于:https://www.cnblogs.com/greyzeng/p/9581624.html你为何来上课并且认真参与?(http://www.scalerstalk.com/816-attention)认真听课本就是学生的本分,但一节课40分钟没有走神估计很少人能做到。可能有时候老师确实讲的不够精彩,不足以吸引学生,但这不能够成为逃课或者不听的理由,去到教...

2018-09-09 21:54:00 43

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除