- 博客(16)
- 资源 (2)
- 收藏
- 关注
原创 漫画排序算法Python实现
电子书和源码下载:p3xw冒泡排序#冒泡排序的思想,我们要把相邻的元素两两比较,当一个元素大于右侧相邻元素时,#交换它们的位置;当一个元素小于或等于右侧相邻元素时,位置不变。def bubbleSort(list): #range返回一个序列的数 不指定返回具体值 len值长度 for i in range(len(list) - 1): #Python里true、false赋值首字母大写 isSorted = True for j i
2020-09-21 14:53:01
272
原创 大数据集群搭建篇:Hadoop、Spark、ZooKeeper、kafka集群搭建
一、创建虚拟机安装CentOS1.1、安装CentOS1、使用课程提供的CentOS 6.5镜像即可,CentOS-6.5-i386-minimal.iso。2、创建虚拟机:打开Virtual Box,点击“新建”按钮,点击“下一步”,输入虚拟机名称为spark1,选择操作系统为Linux,选择版本为Red Hat,分配1024MB内存,后面的选项全部用默认,在Virtual Disk File location and size中,一定要自己选择一个目录来存放虚拟机文件,最后点击“create”按钮
2020-06-07 15:05:11
1078
原创 C#调用Python的两种方法
方法一:Python.Runtime调用用Python.Runtime调用可以调用到python的函数,直接在vs2019的【管理NuGet程序包】下载Python.Runtime.NETStanda和Python的运行环境。 public void pytest() { string CurrentPath = System.IO.Directory.GetCurrentDirectory(); string ScriptFileNam
2020-06-05 16:36:53
3786
1
原创 PL/SQL学习整理
PL/SQL@TOCPL/SQL官方学习文档整理PL/SQL是 Procedure Language & Structured Query Language(过程语言与结构化查询语言) 的缩写。PL/SQL是对SQL语言存储过程语言的扩展。存储过程是事先经过编译并存储在数据库中的一段SQL语句的集合,调用存储过程可以简化应用开发人员的很多工作,减少数据在数据库和应用服务器之间的传输,...
2020-05-21 15:38:26
254
原创 笔记001-eclipse【Scala IDE】启动的时候报错an error has occurred.see the log file,不能打开eclipse【Scala IDE】
删除eclipse工作空间下\.metadata\.plugins\org.eclipse.e4.workbench即可https://mvnrepository.com/artifact/net.sourceforge.htmlunit/htmlunit/2.21
2019-07-20 13:18:29
436
原创 大数据Spark处理算法010-K-mer计数
package cn.spark.study.core;import java.io.Serializable;import java.util.ArrayList;import java.util.Collections;import java.util.Comparator;import java.util.Iterator;import java.util.List;imp...
2019-07-14 14:34:45
757
原创 大数据Spark处理算法009-找出三角形
package cn.spark.study.core;import java.util.ArrayList;import java.util.Arrays;import java.util.Collections;import java.util.List;import org.apache.spark.SparkConf;import org.apache.spark.ap...
2019-07-14 10:03:28
428
原创 大数据Spark处理算法008-KNN
package cn.spark.study.core;import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import java.util.SortedMap;import java.util.TreeMap;import org.apac...
2019-07-02 20:25:29
287
原创 大数据Spark处理算法006-基于内容的电影推荐
package cn.spark.study.core;import java.util.ArrayList;import java.util.List;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.Java...
2019-06-29 19:03:13
433
原创 大数据Spark处理算法005-查找共同好友
package cn.spark.study.core;import java.util.ArrayList;import java.util.Arrays;import java.util.HashMap;import java.util.List;import java.util.Map;import org.apache.spark.SparkConf;import org...
2019-06-28 20:58:19
286
原创 大数据Spark处理算法004-查找共同好友
package cn.spark.study.core;import java.util.ArrayList;import java.util.Arrays;import java.util.HashMap;import java.util.HashSet;import java.util.List;import java.util.Map;import java.util.Map...
2019-06-26 19:48:12
304
原创 大数据Spark处理算法003-购物篮分析(MBA)
一前言目的:设定一个买东西的应用场景计算出如果购买了商品A,则购买商品B,的概率。A与B指一个或几个商品。首先介绍俩个概念:支持度(Support):是指一个项集出现频度。如Support({A,C}) = 2表示只在两次交易中商品A和C在一起出现。置信度(Confidence):关联规则左件和右件共同出现的频繁程度。Support = ({A1,A2})/ 包含项目A1...
2019-06-23 15:49:29
664
原创 大数据hadoop操作命令
start-dfs.sh 开启hadoophadoop dfs -ls / 查看跟目录所有文件(/接目录名及查看该目录下文件)hadoop dfs -put 本地文件/hadoop目录hadoop dfs -mkdir /目录名 创建目录hadoop fs -rm -r -skipTrash /MBA/transactionsMBA.txt 删除transactionsMB...
2019-06-14 21:55:47
175
原创 大数据Linux基础命令
scp -r spark-1.5.1-bin-hadoop2.4/ root@spark02:/usr/local/ 拷贝文件到另一个系统.bashrc 环境变量source ~/.bashrc 重启环境变量mkdir 创建目录mv ...
2019-06-14 21:55:37
116
原创 大数据Spark处理算法002-TopN
package cn.spark.study.core;import java.io.Serializable;import java.util.Collections;import java.util.Comparator;import java.util.Iterator;import java.util.List;import java.util.Map;import jav...
2019-06-13 21:10:03
188
原创 大数据Spark处理算法001-Top10
目的:找出Top10喵星人处理思路:1.初始化创建Spark Masater的连接。2.创建JavaRDD(lines)从HDFS(Hadoop分布式文件系统)读取一个txt文件,本例使用的文件为Top10.txt。3.用lines创建JavaPairRDD4.创建一个本地Top10数据5.收集所有的本地top10并创建最终的top10列表步骤1:初始化创建Spar...
2019-06-01 17:03:14
828
oracle.zip
2020-05-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人