自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

xfei.zhang

不积跬步,无以至千里;不积小流,无以成江海。

  • 博客(143)
  • 资源 (1)
  • 收藏
  • 关注

原创 知识导航

顶会论文ACL: https://acl2017.wordpress.com/2017/04/05/accepted-papers-and-demonstrations/NIPS:https://nips.cc/Conferences/2017/Schedule?type=PosterICML:https://icml.cc/Conferences/2017/Schedule?type...

2018-03-09 10:51:32 1558 1

原创 eclipse + pydev + spark + hadoop

1. java 安装http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.htmljdk我选择linux x86版本gz注意安装好后,需要更新/usr/bin/java 软连接为解压后的javajava -version要显示下载后的版本号2. eclipse 安装htt

2017-05-24 16:01:30 1177

原创 git 常见问题

1. 正常做项目:git clone http://.....git checkout your-dev-branchscp -p -P 29418 userid@ipaddress:hooks/commit-msg .git/hooks/export EDITOR=vimedit source codegit add . / git rm filepathgit co

2017-05-20 16:59:16 451

原创 DBUS 实现c/s 全双工

前一篇文章主要介绍了dbus调用的流程,及简单的单工通信,这里记录下双工通信的流程,供后续参考。定义dbus名称,路径,接口,方法等。#define TEST_DBUS_A "methodA"#define TEST_DBUS_B "methodB"#define TEST_DBUS_INTERFACE "com.test.hello"#define TEST_DBUS_OBJPATH "/com/test/hello"#define TEST_DBUS_NAME "com.test.hell

2017-05-06 18:50:03 1632

原创 c++ 准则

1. 没有面向对象也可以使用c++,因为c++=c+OO+template+stl,高效编程取决于使用c++的哪一部分特性 2. 尽量少用#definea)const替换常量:const double ration = 2.3;const char* const name="jack";const std::string name("jack");class A{

2017-02-06 16:54:22 401

原创 算法考试小结

考试步骤:1. 花15分钟阅读题目,题目信息量大的时候需要注意给定的condition2. 花15分钟解析题目,从简单的case开始分析,分析出处理问题的步骤3. 根据解决问题的步骤尝试套用已有算法:     @  是否是单源最短路径题目:djstra    @ 是否是多源最短路径: floyd    @  是否含有负权:bellman ford    @ 是否是最小生

2016-07-26 21:15:50 667

原创 DFS 小结

DFS从实现角度看有两种方法:1. 迭代写法:自己实现一个stack,类似bfs的写法,只不过将queue改成stack而已2. 递归写法:基本框架dfs(){    1.   退出点,例如到达目的点    2.   剪枝点,优化点,当前耗费已经大于之前得到的Answer    3.  循环体,决策项,例如上下左右等}  DFS从题型上划分,有两种类型:

2016-07-26 21:02:23 778

原创 Spark PairRDD 行动与数据分区

package edu.berkeley.simple_project;import java.util.ArrayList;import java.util.Arrays;import java.util.List;import java.util.Map;import java.util.Map.Entry;import org.apache.spark.HashPartiti

2016-02-03 19:55:00 1399

原创 Spark RDD 行动

测试过程中会出现大量INFO,影响调试修改conf下log配置文件log4j.rootCategory=WARN, console

2016-01-31 11:42:59 558

原创 Spark RDD 转化

package com.fei.simple_project;import java.util.Arrays;import org.apache.spark.SparkConf;import org.apache.spark.api.java.JavaPairRDD;import org.apache.spark.api.java.JavaRDD;import org.apache.

2016-01-30 21:16:22 1688

原创 Spark RDD 转化与行动基础

package com.fei.simple_project;import org.apache.spark.api.java.function.Function;public class ContainsSomething implements Function { private String query; public ContainsSomething(String mquer

2016-01-30 17:22:07 654

原创 spark 命令行环境 python

1. 安装python,安装好后查看python版本$ python --versionPython 2.7.6从下面的pyspark.sh中可以看出,默认是支持2.7的python(spark版本是spark-1.6.0-bin-hadoop2.6)if hash python2.7 2>/dev/null; then # Attempt to use Python 2.7,

2016-01-24 10:09:35 7848

原创 基于eclipse maven 开发 spark 集群计算

1. 根据前面的文章,搭建好spark on yarn的集群,即hadoop和spark均搭建成功/usr/local/hadoop/sbin/start-all.sh启动hadoo yarn6661 NameNode7163 ResourceManager7300 NodeManager7012 SecondaryNameNode3119 7512 Jps6795 Dat

2016-01-23 21:51:14 580

原创 Spark on Hadoop Yarn 部署

前提:haoop yarn已经部署完毕,关于hadoop yarn的部署已经在前面文章中说明1. 安装scala下载scala-2.11.7.tgzsudo ln -s /home/tizen/share/software/scala-2.11.7 scalaexport SCALA_HOME=/usr/local/scalaexport PATH=$PATH:$SCA

2016-01-19 19:38:39 568

原创 32 位 的hadoop 编译hadoop 2.7.1

1. 安装jdk, 直接apt get openjdk-7-jdk2. 安装openssl ,直接apt get openssl3. 安装maven,直接apt get maven4. 安装protobuftar -zxf protobuf-2.5.0.tar.gzcd protobuf-2.5.0 ./configure --prefix=/u

2016-01-17 21:28:03 565

原创 Hadoop Yarn connection refused 警告

$ start-dfs.sh 16/01/17 16:17:04 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicableStarting namenodes on [OpenJDK Cli

2016-01-17 16:18:48 1310

原创 Hadoop Yarn 集群 从节点的data node没有启动成功

jps发现主节点的datanode启动成功,但是次节点的datanode没有启动成功发现log如下:the: ssh: connect to host the port 22: Connection timed outOpenJDK: ssh: connect to host openjdk port 22: Connection timed outtizen@datanode's

2016-01-17 15:50:03 1746

原创 Hadoop Yarn集群 主节点的 data node没有启动成功

在启动hadoop集群的时候,jps发现主节点的data node没有启动。首先查看loggedit /usr/local/hadoop/logs/hadoop-tizen-datanode-samsung.log如下:capacity-scheduler/*.jarSTARTUP_MSG:   build = https://git-wip-us.apache.org/r

2016-01-17 14:47:59 2846

原创 hadoop Yarn 搭建集群时错误 主节点 NameNode 没有启动成功

执行start-dfs.sh发现namenode没有启动成功,查看日志后发现如下错误2016-01-17 14:32:11,562 INFO org.apache.hadoop.util.GSet: Computing capacity for map NameNodeRetryCache2016-01-17 14:32:11,562 INFO org.apache.hadoop.

2016-01-17 14:06:57 2612

原创 Hadoop Yarn 集群搭建

1. 服务器部署192.168.0.101  主名字节点192.168.0.101  备名字节点192.168.0.101  数据节点1192.168.0.102  数据节点22. /etc/hosts 设置192.168.0.101  namenode192.168.0.102  datanode3. ssh 免密码登录$ ssh-keygen -t

2016-01-17 14:04:36 622

原创 jersey 基于tomcat web service 开发 restful service

1. 安装好jdk2. 根据前面的文章介绍,创建好tomcat运行时环境3. 这里对tomcat的配置重点提出来,以避免本人在实验的时候遇到的众多诡异问题tomcat解压后有RUNNING.txt。根据里面的guide,大家需要配置好以下内容CATALINA_HOME的环境变量为E:\apache-tomcat-8.0.30CATALINA_BASE不需要设置JAVA_

2016-01-07 20:44:35 665

原创 python 的打包及安装 distutils

命令如下:python setup.py --help-commands python setup.py sdist   创建一个源码包发布 python setup.py bdist 创建一个二进制包发布 以什么样的格式打包zip,tar,rpm 可以通过以下命令查看:python setup.py sdist --help-formatspython setup.p

2015-12-31 21:14:28 1889

原创 CMake 创建静态库及动态库供函数调用

CMake 创建静态库及动态库供函数调用,下面是项目的树状图.├── cmake_fei│ ├── build│ ├── CMakeLists.txt│ ├── doc│ │ ├── readme.txt│ │ └── CMakeLists.txt│ ├── libhello│ │ ├── CMakeLists.txt│ │ ├

2015-12-31 20:21:38 5744 1

原创 rpmbuild spec CMake 创建项目的rpm 包

rpmbuild spec CMake 创建项目的rpm 包,下面是项目的树状图.├── cmake_fei│ ├── build│ ├── CMakeLists.txt│ ├── doc│ │ ├── readme.txt│ │ └── CMakeLists.txt│ ├── libhello│ │ ├── CMakeLists.txt

2015-12-31 20:10:29 2024

原创 DBus 实现IPC的 配置 及流程 及 代码实现

com.test.hello.service,安装到dbus系统目录下[D-BUS Service]Name=com.test.helloExec=/bin/falseSystemdService=hello.servicehello.service,安装到systemd下[Unit]Description=hello[Service]Type=dbusBusNam

2015-12-31 20:06:03 2183 1

原创 Linux 多线程 网络编程 管道 socket等相关心得

1. IPC信号量:ftok,semget/semctl/semop信号:signal截取信号,可以自定义管道:pipe,fd0,fd1,read/write,一边关闭读,一边关闭写,半双工消息队列:ftok,msgget/msgctl共享内存:ftok,shmget/shmat/shmdt,最快套接字:socketDBUS:消息总线,重量级2. 睡眠Sleep

2015-12-31 09:04:45 686

原创 利用后缀数组 前缀 LCP最长公共前缀求第K大的子串

下面借助一道题目和大家一起讨论:后缀树及后缀数组的问题题目:food所有的组成情况如下:d           ffofoofoodoodooood按照字母顺序排列如上所示,先要求第k大的子串,例如第8大子串为oo思路:蛮力就不说了,高级别考试肯定超时。这种题目是典型的利用后缀树和后缀数组解决的。1. 将所有后缀列出来(prefix set)

2015-12-30 14:28:41 1141

原创 CMake 包含了头文件 找到了so动态库 链接时仍然出现undefined reference to 错误

今天遇到一个CMake 链接问题,这里提出来和大家分享:问题:自己用C语言写了一个动态:libword-counter.so,公开头文件word-counter.h, 其中有函数如:wc_get_word_freq()自己用C++语言写了一个测试工程,在main函数中调用上述库函数wc_get_word_freq。结果出现undefined reference to 的错误分析

2015-12-30 13:59:03 26154 5

原创 Python---http

import urllib.request as urimport http.client as hcimport httplib2import urllib.parse as updef http1(): print('==========http1================================') url='http://www.njzz.gov.cn/Pad/

2015-12-28 20:12:18 336

原创 Socket---基于IO复用实现异步非阻塞通信 Python群聊工具

服务器端程序:import socketimport signalimport selectMAX_LISTEN_N = 100MAX_BUFFER_N = 1024mconnections = {}addresses = {}datalist = {}IP_ADDR = '192.168.1.2'PORT = 4547def remove_fd_data(fd):

2015-12-28 19:48:48 779

原创 子集subset问题

子集subset问题 字集即组合的集合例如求ABCD的字集,即求ABCD中任取0个的情况+ABCD中任取1个的情况+ABCD中任取2个的情况+ABCD中任取3个的情况+ABCD中任取4个的情况。 遇到字集问题,首先想到暴力求法,即所有元素均有两种情况:取或不取。因此暴力求法可以使用四层for循环解决上述问题。 然而是否有更简单的方法?答案显然是肯定的,即利用前面

2015-12-23 20:48:54 535

原创 位操作在算法中的运用

1. 与操作&100 & 111 = 100 2. 或操作|100 | 000 = 100 3. 异或^100 ^ 000 = 100 4. 取反~~100 = 011 5. 向左移位1即2的2次方,等于4 6. 向右移位>>16>>2 = 00100即16的2的-2次方,等于4 note1:移位和与操作结合,用来

2015-12-23 19:46:31 431

原创 拷贝anaconda环境,替换绝对地址

find . -type f -exec sed -i 's/\/home\/tizen\/anaconda3/\/data\/aif\/common\/conda-share/g' {} \;find . -type f -exec sed -i 's/common36/py36/g' {} \;find . -type f -exec sed -i 's/\/home\/tizen...

2019-08-26 20:07:32 620

原创 test

https://www.jianshu.com/p/97cb3b6db573

2019-02-23 20:55:27 179

原创 Kaggle solution 1: Mercari Price Suggestion Challenge

import pandas as pdimport numpy as npimport scipyimport mathimport timefrom sklearn.linear_model import Ridge, LogisticRegressionfrom sklearn.model_selection import train_test_split, cross_val_

2018-02-07 10:07:11 870

原创 kaggle---titanic

import numpy as npimport scipy as spimport matplotlib.pyplot as pltimport pandas as pdfrom pandas import *from test import *from pandas import DataFramefrom sklearn.ensemble import RandomFore

2018-02-06 10:58:34 338

原创 AI

Good resources I used to use ^^机器学习coursea课程:AndrewNg https://www.coursera.org/learn/machine-learning#syllabus 机器学习实战(Peter):https://book.douban.com/subject/24703171/ 机器学习(周志华):https://book.douban

2018-02-05 21:05:17 427

原创 kaggle base line: Mercari Price Suggestion Challenge

import mathimport numpy as npimport scipy as spimport matplotlib.pyplot as pltimport pandas as pdfrom pandas import *import sklearnfrom sklearn.preprocessing import *from sklearn.feature_sel

2018-02-05 20:31:39 579

转载 flask rest

转载于:https://www.cnblogs.com/knarfeh/p/5616515.html环境简介Ubuntu我使用的 Ubuntu 系统版本是 14.04,用过几个 Linux 发行版,现在挑选系统的第一选择基本就是 Ubuntu 了,因为 Ubuntu 有商业公司Canonical 做开发维护;使用的人多,有庞大的社区支持;遇到问题容易解决。我折腾过很长时间的

2017-11-16 11:34:40 659

转载 rest/flask/nginx/uwsgi/supervisor

感谢原文作者http://www.cnblogs.com/Ray-liang/p/4173923.html?utm_source=tuicool&utm_medium=referral我采用的部署方案是:Web 服务器采用 uwsgi host Flask用 Supervisor 引用 uwsgi 作常规启动服务基于 Nginx 作反向代理首先, 阿里云服务器可以通过 SSH 指令在本机的终端进

2017-11-16 11:23:07 499 7

c c++ chm api手册

c c++ chm api手册 用于开发c cpp程式 参考手册

2015-03-08

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除