自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

机器学习菜鸟

机器学习、数据挖掘、数据分析

  • 博客(17)
  • 资源 (27)
  • 问答 (2)
  • 收藏
  • 关注

原创 常用的HDFS下的文件命令

删除hdfs下的所有文件:hadoop fs -rmr hdfs:192.168.80.100:9000/*查看hdfs下的所有文件:hadoop fs -lsr /查看hdfs下的hello文件的内容:hadoop fs  -text  /hello下载hdfs下某个文件:hadoop fs -get src des

2016-07-23 17:31:52 433

原创 向HDFS上传文件时报错16/07/23 01:13:30 WARN hdfs.DFSClient: DataStreamer Exception: org.apache.hadoop.ipc.Rem

16/07/23 01:13:30 WARN hdfs.DFSClient: DataStreamer Exception: org.apache.hadoop.ipc.RemoteException: java.io.IOException: File /test.txt could only be replicated to 0 nodes, instead of 1        at

2016-07-23 16:19:23 8071 2

原创 Name node is in safe mode 解决办法

今天在用hadoop fs -text /m.txt时,没有显示文本内容,弹出信息有Name node is in safe mode查了一下,离开safe mode就可以执行一下:hadoop dfsadmin -safemode leave

2016-07-23 14:45:08 2022

原创 oracle遇到问题整理

问题:我的plsql昨晚还能正常登陆,今天就无法登陆了,报错是无监听程序查找原因:1.先看看用命令行是否能连接数据库cmd-sqlplus输入用户名,密码2.如果1能登陆,用plsql无法登陆说明是监听程序出问题了可能原因是ip变化了查找两个文件,listener.ora和tnsname.ora,这两个文件的路径在F:\oracle\product\10.2.0\db_

2016-07-23 14:07:02 248

原创 错误: 非法字符: \65279解决办法

今天在加载文件时,突然报出这样错误错误: 非法字符: \65279经过网上查找资料,发现这是与编码格式有关,加了BOM,变成了UTF-8 BOM,去掉BOM就可以了用Notepad++,点击格式——选择用UTF-8 无BOM编码格式编码,就可以了

2016-07-15 13:41:48 985

转载 几种任务调度的 Java 实现方法与比较

http://www.cnblogs.com/shenliang123/p/3231312.html

2016-07-14 14:13:25 392

原创 用ScheduledExecutorService实现任务调度

ScheduledExecutorService实现任务调度,定时循环执行代码如下:package com.shentong.limitcsv;import java.util.Calendar;import java.util.concurrent.Executors;import java.util.concurrent.ScheduledExecutorService;im

2016-07-14 10:32:42 477

原创 解决Eclipse中SVN版本信息不显示的问题

不知道什么原因,eclipse中svn的版本信息不显示了,无法清晰的看出哪些文件同svn不同了,非常不方便解决办法也很简单:打开 : windows ->preferences->General->Appearance->Lable Decorations  勾选其中的 SVN 然后再刷新一下,eclipse就显示修改版本信息了

2016-07-13 16:22:40 788

原创 虚拟机之间免密登陆

1.在各自机器上生成公钥文件2.公钥文件复制到主机scp id_rsa.pub root@192.168.188.100:/root/.ssh/id_rsa_02.pub其中root目标机的登陆用户,192.168.188.100是目标机ip

2016-07-13 16:20:31 3650

原创 解压rpm文件

rpm ivh file

2016-07-13 10:07:41 1603

转载 在用hadoop fs -ls 时报failed onconnetion的错误

[root@centos-ywf bin]# hadoop fs -ls hdfs://centos-ywf:9090/Warning: $HADOOP_HOME is deprecated.16/07/10 01:42:23 INFO ipc.Client: Retrying connect to server: centos-ywf/127.0.0.1:9090. A    

2016-07-10 16:54:44 1493

转载 伪分布式安装Hadoop笔记

1.hadoop的伪分布安装1.1 设置ip地址执行命令 service network restart验证: ifconfig1.2 关闭防火墙执行命令 service iptables stop验证: service iptables status1.3 关闭防火墙的自动运行执行命令 chkconfig iptables off验证: chkconfig -

2016-07-10 14:29:24 218

转载 安装Hadoop 2.x时主机名不能包含下划线

http://f.dataguru.cn/thread-267161-1-1.htmlhttp://www.aboutyun.com/thread-7118-1-1.htmlhttp://blog.csdn.net/lifuxiangcaohui/article/details/20233607--日志查看今天在安装hadoop时,按照要求修改了文件,最后执行了hadoop

2016-07-10 14:20:38 1333

转载 tar 命令详解

http://www.cnblogs.com/jyaray/archive/2011/04/30/2033362.htmltar命令详解-c: 建立压缩档案-x:解压-t:查看内容-r:向压缩归档文件末尾追加文件-u:更新原压缩包中的文件这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个。下面的参数是

2016-07-10 11:11:35 348

转载 在修改etc/profile过程中如果PATH前不小心忘记添加$,导致vi命令无法使用怎么办?

今天学习LINUX 下配置jdk 和安装tomcat 通过VI编辑/etc/profile  在export 时候把路径弄错了。保存后启动。虽然java安装好了。但是相关的ls more vi 的命令都不好使了。而且没装FTP所以在windows下连接进去修改/etc/profile文件此路也就走不通。真悲剧了。难道我要重装系统?心不甘。自己想了想。一般我记得vi是在/bin/下。那么根据

2016-07-10 10:48:00 3012

转载 Linux常用命令笔记

1.通过远程工具登陆到linux后,所在的位置是当前登录用户的家目录(home directory)。2.家目录的符号用~表示。3.linux的文件系统是一个树结构。  linux文件系统的树根成为根目录,使用符号"/"表示。  linux文件系统中使用符号".."表示上级目录。  linux文件系统中使用符号"."表示当前目录。  linux文件系统中,如果文件使用“.”

2016-07-09 13:50:40 249

原创 在命令行调用Junit测试类

今天测试程序时,需要用到在命令行下调用jar包,测试Junit,在网上找了一下相关资料整理了一下需要如下文件:1.bat脚本里面的内容如下:set path=D:/Program Files/Java/jre7/binjava  -cp "lib/*;"  -Xms256m -Xmx4000m org.junit.runner.JUnitCore com.shentong.

2016-07-08 12:52:01 1758

Heart Attack Analysis & Prediction Dataset

Heart Attack Analysis & Prediction Dataset

2024-05-14

利用python中的re模块正则匹配

利用python中的re模块正则匹配

2023-06-14

高德城市编码表excel格式

高德城市编码表

2023-04-20

坐标系转换库proj源码

坐标系转换proj库源码

2022-08-11

坐标系转换库 proj 教程

PDF Manual proj.pdf https://proj.org/download.html 手册文档

2022-08-11

国内常用EPSG坐标系

坐标系转换需要的资源

2022-08-11

关闭HttpClient日志的logback文件

关闭HttpClient日志的logback文件

2020-11-21

手写识别数据集MNIST

MNIST 数据分为两个部分。第⼀部分包含 60,000 幅⽤于训练数据的图像。这些图像扫描 ⾃ 250 ⼈的⼿写样本,他们中⼀半⼈是美国⼈口普查局的员⼯,⼀半⼈是⾼校学⽣。这些图像 是 28 × 28 ⼤小的灰度图像。第⼆部分是 10,000 幅⽤于测试数据的图像,同样是 28 × 28 的灰 度图像。

2018-06-21

通过jdbc链接hive所需要的jar包

通过jdbc链接hive时所需要的jar包,把需要的jar都下载下来汇总到一起,供有需要的人使用

2018-05-08

hive jar包

hive metastore jar包,可以直接下载使用,hadoop,hive

2018-05-07

win7下注释掉checkReturnValue方法体后的jar文件

Exception in thread "main" java.io.IOException: Failed to set permissions of path: \tmp\hadoop-ywf\mapred\staging\ywf1760469788\.staging to 0700 win7下报错,需要注释掉checkReturnValue的方法体

2018-05-07

UCI分类数据集

UCI数据集

2017-08-17

Weka 3.4 教程

Weka3.4教程

2017-08-17

selenium源码

selenium源代码

2016-09-27

WeatherCrawl

提供了解析天气网址信息的程序

2016-07-15

CrawlerDemo

利用url,httpurlconnection,socket爬取任意网页demo

2015-04-17

利用TikaAPI解析各种文档

利用开源工具Tika解析PDF文档,HTML文档,微软形式的文档

2015-01-23

复旦自然语言处理技术NLP

复旦NLP,自然语言处理技术,很棒的奥,包括了分词,词性标注,命名体识别

2015-01-08

最大连续子串问题

求一个数组的最大连续子串,和最大的串即为最大连续子串,其中还包括了最大连续子矩阵

2015-01-08

K均值聚类算法

利用k均值聚类算法对词进行聚类,输入是词之间的相似度矩阵

2015-01-08

建立二叉树,前后中序遍历二叉树,求二叉树的深度

建立二叉树,前后中序遍历二叉树,求二叉树的深度

2015-01-08

通过JAVA执行命令行程序

文件中包含两个方法,一个是读取文件路径下的文件列表,另一个是通过JAVA调用命令行程序,涉及到线程阻塞问题

2013-08-17

Dijkstra算法JAVA代码

Dijkstra 求任意两个点的最短路径算法

2013-08-01

JAVA 常见的小程序

这是我在自学JAVA时练习写的小程序,包括 递归,继承,排序,打印星型,随机数等,适合初学JAVA的练习

2013-04-07

JAVA程序员必读-基础篇

JAVA程序员的基础知识,适合初学者学习

2013-04-07

数据结构、算法及应用代码

数据结构算法及应用 源代码 书籍作者是 Sartaj Sahni著 孔芳 高伟译

2012-12-06

JAVA笔记总结

自己学习JAVA,总结的笔记,适合初学JAVA学习

2012-11-15

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除