bagaichang8396
码龄9年
关注
提问 私信
  • 博客:7,978
    7,978
    总访问量
  • 暂无
    原创
  • 1,047,245
    排名
  • 1
    粉丝
  • 0
    铁粉
  • 加入CSDN时间: 2016-04-24
博客简介:

bagaichang8396的博客

查看详细资料
  • 原力等级
    当前等级
    0
    当前总分
    0
    当月
    0
个人成就
  • 获得1次点赞
  • 内容获得0次评论
  • 获得11次收藏
创作历程
  • 15篇
    2018年
  • 6篇
    2016年
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

hive基本操作与应用

通过hadoop上的hive完成WordCount启动hadoopHdfs上创建文件夹上传文件至hdfs 准备文件song.txt: 上传到hdfs/data文件中启动Hive创建原始文档表导入文件内容到表docs并查看 导入:...
转载
发布博客 2018.05.15 ·
136 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Hadoop综合大作业

1.用Hive对英文长篇小说进行词频统计。利用WinSCP 英语长篇小说文本文件放于 /home/hadoop/wc 目录下:启动hadoop:上传到hdfs/data文件中启动Hive在hive数据库创建表 world:导入文本world.txt并查看:用HQL...
转载
发布博客 2018.05.22 ·
170 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

熟悉HBase基本操作

1. 以下关系型数据库中的表和数据,要求将其转换为适合于HBase存储的表并插入数据:学生表(Student)(不包括最后一列)学号(S_No)姓名(S_Name)性别(S_Sex)年龄(S_Age)课程(course)2015001Zhangsanmale23...
转载
发布博客 2018.05.08 ·
148 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

理解MapReduce计算构架

用Python编写WordCount程序任务程序WordCount输入一个包含大量单词的文本文件输出文件中每个单词及其出现次数(频数),并按照单词字母顺序排序,每个单词和其频数占一行,单词和频数之间有间隔编写map函数,reduce函数map函数:red...
转载
发布博客 2018.05.10 ·
155 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

熟悉常用的HDFS操作

一、Hadoop提供的Shell命令完成相同任务:在本地Linux文件系统的“/home/hadoop/”目录下创建一个文件txt,里面可以随意输入一些单词.在本地查看文件位置(ls)在本地显示文件内容使用命令把本地文件系统中的“txt”上传到HDFS中的当前用户目录的input目录下。查看hdfs中的文件(-ls)显示hdfs中该...
转载
发布博客 2018.04.26 ·
182 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

爬虫大作业

一、主题 : 爬取博客园博问上160页每页25条帖子标题,利用jieba分词生成词云进行分析二、python爬取数据 博问主页:https://q.cnblogs.com/list/unsolved?page=1 第二页:https://q.cnblogs.com/list/unsolved?page=2 以此类推…...
转载
发布博客 2018.04.22 ·
616 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

数据结构化与保存

1. 将新闻的正文内容保存到文本文件。def addcontent(content): f = open("F:/study/大三/大数据/content.txt", "a") f.write('
'+content) f.close()2. 将新闻数据结构化为字典的列表:单条新闻的详情-->字典news一个列表页所有...
转载
发布博客 2018.04.17 ·
108 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

使用正则表达式

学会使用正则表达式import requestsimport matchimport renewsurl = 'http://news.gzcc.cn/html/xiaoyuanxinwen/'res = requests.get(newsurl) res.encoding = 'utf-8'from bs4 import BeautifulSoup...
转载
发布博客 2018.04.10 ·
154 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

网络爬虫基础练习

练习:新建一个用于练习的html文件,在浏览器中打开。<!DOCTYPE html><html lang="en"><head> <meta charset="UTF-8"> <title>Simple DOM Demo</title></head>&l...
转载
发布博客 2018.03.29 ·
155 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

爬取校园新闻首页的新闻

1. 用requests库和BeautifulSoup库,爬取校园新闻首页新闻的标题、链接、正文。import requestsnewsurl = 'http://news.gzcc.cn/html/xiaoyuanxinwen/'res = requests.get(newsurl) # 返回response对象res.encoding = 'utf-8'from bs4...
转载
发布博客 2018.04.04 ·
149 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

组合数据类型综合练习:英文词频统计

1.组合数据类型练习:分别定义字符串,列表,元组,字典,集合,并进行遍历。总结列表,元组,字典,集合的联系与区别。字符串:str1 = "hello everyone"for i in str1: print(i)列表:str2 = ['jay','male',[1996,12,2]]for i in str2: print(i)元组...
转载
发布博客 2018.03.22 ·
165 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

综合练习:词频统计

1.英文词频统计:下载一首英文的歌词或文章song = ''' Passion is sweetLove makes weakYou said you cherised freedom soYou refused to let it goFollow your faith Love and hatenever failed to seize the d...
转载
发布博客 2018.03.27 ·
185 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据概述

1.试述大数据对思维方式的重要影响。 大数据对思维方式带来的转变有三种:全样而非抽样、效率而非精确、相关而非因果。 ①、全样而非抽样:在过去,数据存储和处理能力有限,所以在科学分析中一般采用抽样的方法,而现 在,有了大数据技术的支持,科学分析可以直接针对全样数据进行分析而不是抽样数据; ②、效率而非精确:在科学分析中如果采用抽样分析,则分析需要做到精确,否则分析...
转载
发布博客 2018.03.06 ·
3007 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

Python基础综合练习

import turtledef mygoto(x,y): turtle.up() turtle.goto(x, y) turtle.down()def draw(x): turtle.begin_fill() for i in range(5): turtle.forward(x) turtle.right(144...
转载
发布博客 2018.03.20 ·
183 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

熟悉常用的Linux操作

cd命令:切换目录(1)切换到目录 /usr/localcd /usr/local(2)去到目前的上层目录 cd ..(3)回到自己的主文件夹 cd ~ ls命令:查看文件与目录(4)查看目录/usr下所有的文件 cd /usr ls -al mkdir命令:新建新目录(5)进入/tmp目录,创建一个名为a的目录,并查看有多少目录存在 cd /tm...
转载
发布博客 2018.03.13 ·
409 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

简易版C语言程序语法

<程序> —〉 <外部声明> | <函数定义><外部声明> —〉<头文件> | <变量> | <结构体> <头文件> —〉 #include<文件名><文件名> —〉 stdio.h丨stdlib.h丨string.h<结构体> —〉 <结构体声明〉|...
转载
发布博客 2016.10.27 ·
199 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

C程序语法(无左递归)

<程序> —〉 <外部声明> | <函数定义><外部声明> —〉<头文件> | <变量> | <结构体> <头文件> —〉 #include<文件名><文件名> —〉 stdio.h丨stdlib.h丨string.h<结构体> —〉 <结构体声明〉|...
转载
发布博客 2016.12.02 ·
288 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

词法分析程序(C)

#include <stdio.h> #include <string.h> char string[80],word[8],ch; int type,p,i,n,sum; char keyword[][6]={"begin","if","then","while","do","end"}; //关键字数组 ...
转载
发布博客 2016.10.07 ·
254 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

词法分析实验报告(一)

实验一 词法分析实验专业:商业软件三班 姓名:曾铭杰 学号:201506110197一、 实验目的用C语言设计一个词法分析程序,将字符流的源程序进行分析,从左到右逐个字符地扫描源程序,同时滤掉空格符和回车换行符,逐个读取字符,然后将它们拼在一起组成一个有意义的单词符号,识别出单词的种别及单词自身的值.二、 实验内容和要求1.输入一段...
转载
发布博客 2016.10.13 ·
853 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

我对编译原理的理解

1.编译原理就是什么? 编译就是计算机将人类语言翻译成机器语言的过程,也就是将高级语言翻译成低级语言(0/1),而学习编译原理就是要我们学习整个的翻译过程,即计算机内部如何将高级语言翻译成低级语言。2.学习编译原理有什么好处? 不会编译原理,就相当于一个不会一个英语的人在看一部无中文字幕的英语电影,如果没有人翻译出来字幕,那他就完全都听不懂,但即便不会...
转载
发布博客 2016.09.08 ·
259 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多