自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(42)
  • 收藏
  • 关注

原创 编程题-三数求和

# -*- encoding:utf-8 -*-# A = [1, 1, 2, 2, 2, 2]# target = 5from __future__ import print_functiondef main(A, target): count = 0 num = len(A) hash1 = dict() for indx_i in range(nu...

2019-09-22 03:02:15 1534

原创 spark scala 读取hbase

scala版本:2.10.61.pom.xml<?xml version="1.0" encoding="UTF-8"?><project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" x...

2018-02-28 17:13:53 1864

原创 graphx pagerank 源码解析

1.在spark官网http://spark.apache.org/downloads.html下载source code。参考网址:http://blog.csdn.net/lsshlsw/article/details/411760932.找到pagerank文件的位置为:\graphx\src\main\scala\org\apache\spark\graphx\lib\PageRank.s...

2018-02-27 18:14:00 1299

原创 Sublime Text 3 注册

Help -> enter licenses黏贴:eldonSingle User LicenseEA7E-1122628C0360740 20724B8A 30420C09 6D7E046F3F5D5FBB 17EF95DA 2BA7BB27 CCB1494727A316BE 8BCF4BC0 252FB8FF FD97DF71B11A1DA9 F7119CA0 31984BB...

2018-02-27 10:56:55 249

原创 centos6.7 tensorflow源码安装

虚拟机:vmware workstation 12操作系统:centos 6.71.参照网址设置安装:https://jingyan.baidu.com/article/49711c61964328fa441b7c93.html2.reboot 用户名密码登录3.安装vmtools参照:https://jingyan.baidu.com/article/e8cdb32b136ad637052bad...

2018-02-25 16:38:49 660

原创 python读取hdfs试验

方式一:(成功)1.下载hdfs:pip install hdfs2.程序运行test.pyfrom hdfs.client import Clientclient = Client("http://master66:50070")print(dir(client))filepath="/zhouwu/zzzz/part-00000"with client.read(filepath) a...

2018-02-11 18:40:56 4318

原创 tensorflow centos 6.7 成功案例

probuf下载: https://pypi.python.org/pypi/protobuf/3.0.0b2pip install protobuf-3.0.0b2-py2.py3-none-any.whl tensorflow下载:https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/cpu/pip install tensorflow-0...

2018-02-11 15:08:46 181

原创 vmware workstation 12 centos6.7 anaconda tensorflow 安装

下载vmware workstation 12 和 centos6.7 并安装选择nat网络链接方式中文输入法 参考网址: https://jingyan.baidu.com/article/20b68a885a3607796cec622c.htmlsu root yum install "@Chinese Support" y有“Input Method”选项rebootGLIBC升级[@loc...

2018-02-10 12:42:12 252

原创 Anaconda+Tensorflow环境安装与配置

环境: Centos 6.7anaconda下载地址: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda安装 bash Anaconda2-4.3.1-Linux-x86_64.sh官方下载更新工具包的速度很慢,所以继续添加清华大学 TUNA提供的Anaconda仓库镜像conda config --add channel...

2018-02-10 09:25:04 705

原创 mac 安装 xgboost

1. Terminal run:conda install py-xgboost2. 如果出现:Proceed ([y]/n)? 则选择:y

2017-09-14 23:43:39 282

原创 Mac pro 安装 tensor flow

之前装过caffe,先卸载 brew uninstall protobufpip install tensorflow

2017-09-06 22:20:57 384

原创 括号匹配算法

#include #include #include #include #include using namespace std;vector braces(vector values){ vector res; for(int i=0;i<values.size();i++){ stack s; char c; string flag = "YES"; strin

2016-10-12 22:31:25 551

原创 C++ 文件输入输出

系统:Mac OS 编程工具:Sublime Text 21.保存至文件//fstream包含ifstream,ofstream,fstream类,继承于istream,ostream类#include using namespace std;int main(){ ofstream saveFile("word.txt");//如果该文件存在,则替换;如果不存在,则创建 s

2016-10-10 16:17:22 332

原创 C++ 编程 建立Trie Tree

Trie—单词查找树

2016-10-09 23:16:31 977

翻译 支持向量机SVM(Support Vector Machine)

支持向量机

2016-10-03 13:12:34 555

翻译 this指针

this指针作用域为类内部,当类的非静态成员函数中访问类的非静态成员的时候,编译器会自动将对象的地址作为一个隐含形参,对各成员的访问均通过this进行。this指针只能在成员函数中使用。

2016-09-30 19:11:26 211

原创 编程题 电话号码分身

题目描述:首先将电话号码中的每个数字加上8然后取个位,然后使用对应的大写字母代替(“ONE”,“TWO”,“THREE”,“FOUR”,“FIVE”,“SIX”,“SEVEN”,“EIGHT”,“NINE”),然后随机打乱这些字母,所生产的字符串即为电话号码对应的分身。输入:第一行为一个整数T,接下来T行,每行给定一个分身后的电话号码输出:输出T行,分别对应输入中每行对应分身前的最小电话号

2016-09-24 22:57:48 1821

原创 引用案例tricky

例1.合法double ival=2.01;int ival1=ival;例2.不合法int ival1=2.01;例3.不合法const int ival1=2.01;例4.合法double ival=2.01;const int ival1=ival;例5.合法(tricky)double ival=2.01;con

2016-09-22 22:19:17 284

转载 【整理】辗转相除法求最大公约数算法证明

描述:关于辗转相除法的具体实现在这里就不具体说明了,本文要记录的是辗转相除法应用于求最大公约数的算法证明过程。  假设:求m和n的最大公约数。a,b分别是m除以n的商和余数,即m=na+b。gcd(m,n)表示m和n的最大公约数。  求证:gcd(m,n)=gcd(n,b)  证明:    设c=gcd(m,n), d=gcd(n,b)  1

2016-09-07 22:34:14 447

转载 深度学习必知的框架

GitHub上有很多不错的开源项目值得关注。一、Caffe。源自加州伯克利分校的Caffe被广泛应用,包括Pinterest这样的web大户。与TensorFlow一样,Caffe也是由C++开发,Caffe也是Google今年早些时候发布的DeepDream项目(可以识别喵星人的人工智能神经网络)的基础。Caffe入门学习资料:http://www.csdn.net/articl

2016-08-09 20:41:54 648

转载 卷积神经网络

转载来源于:http://blog.csdn.net/stdcoutzyx/article/details/41596663自今年七月份以来,一直在实验室负责卷积神经网络(Convolutional Neural Network,CNN),期间配置和使用过theano和cuda-convnet、cuda-convnet2。为了增进CNN的理解和使用,特写此博文,以其与人交流,互

2016-08-09 15:06:02 353

转载 零Linux基础安装hadoop过程笔记

链接地址:http://www.cnblogs.com/syveen/archive/2013/05/08/3068044.html环境及目标:- 系统:VMWare / Ubuntu 12.04- Hadoop版本:0.20.2- 我的节点配置 (完全分布式集群)Master (job tracker) 

2016-08-07 12:15:47 226

转载 实例讲解虚拟机3种网络模式(桥接、nat、Host-only)

前言很多人安装虚拟机的时候,经常遇到不能上网的问题,而vmware有三种网络模式,对初学者来说也比较眼花聊乱,今天我就来基于虚拟机3种网络模式,帮大家普及下虚拟机上网的背景知识。(博文原创自http://www.cnblogs.com/ggjucheng/archive/2012/08/19/2646007.html)虚拟机网络模式无论是vmware,virtual box,v

2016-08-07 11:50:32 229

原创 DNS域名解析

DNS是动态域名系统的英文简称,是用来把我们输入的域名解析成IP地址的,如果没有DNS我们输入的例如www.baidu.com这样的域名就无法被访问。如果我们访问网站的时候要输入ip地址的话,显然既不方便也不容易记忆,所以我们用域名来访问网站。域名虽然便于人们记忆,但网络中的计算机之间只能互相认识IP地址,所以,他们之间需要转换。它们之间的转换工作即称为域名解析,域名解析需要由专门的域

2016-08-07 11:35:16 320

转载 解决mac下sublime text 2 无法读取cin,scanf的问题

Mac下用sublime text2 编译运行C++程序,编译成功,但是在按下ctrl+shift+B运行时无法在sublime text2的console窗口输入数据,如下程序所示,直接跳过了cin >> n那行代码,导致cout C/C++ code?123456789

2016-08-06 09:50:49 1877

转载 在线音乐播放器的推荐机制

对于我这样一个音乐控来说,学习工作时没有音乐是万万不行的。在网易云音乐云音乐面世之前,我总是在QQ音乐,百度音乐等播放器之间徘徊,当时也不够文艺,不知道豆瓣FM的存在。第一次接触云音乐被其吸引的原因有二,第一是开门见山先答十道题,根据答案生成个性化推荐,给人耳目一新的感觉。第二是每首歌下面的评论区,许多内容能和自己产生共鸣。这两点让我对这款软件颇有好感。如今在云音乐听歌一万有余,之

2016-08-05 13:20:51 2224

原创 Precision ROC Recall

Precision 反映了分类器预测正例的准确程度。其补数就是误检率。recall也就是true positive rate (tpr),反映了分类器对正例的覆盖能力。其补数就是漏检率。ROC曲线的横轴和纵轴分别是false positive rate 和true positive rate,可以理解为将负例分为正例的概率,以及将正例分为正例的概率。注意,这里的分母都是实际的正例/

2016-08-01 16:53:17 328

转载 如何检测网站的活跃用户与流失用户

网站用户管理的目标是发掘新用户,保留老用户。但仅仅吸引新用户还不错,还需要保持新用户的活跃度,使其能持久地为网站创造价值;而一旦用户的活跃度下降,很可能用户就会渐渐地远离网站,进而流失。所以基于此,我们可以对用户进行又一个细分——活跃用户和流失用户。活跃用户与流失用户  活跃用户,这里是相对于“流失用户”的一个概念,是指那些“存活”着的用户,用户会时不时地光顾下网站,同时为网站带来

2016-07-31 16:53:12 2542

转载 自己动手编译、运行Java程序

本人初学Java,看到别人都说学Java先不要用Eclipse、NetBeans这些开发工具,所以索性就自己试试。过程犯的错误极多,参照着李刚老师那本疯狂Java一点一点的实验.由于自己使用过Makefile,所以就用Makefile做了实验,总算是可以不用Eclipse、NetBeans就能自己编译运行一些小的程序了,下面就是我自己总结的心得,如有错误,请大家指正,谢谢。本文分四小节:

2016-03-30 13:40:03 205

转载 关于凸优化的一些简单概念

没有系统学过数学优化,但是机器学习中又常用到这些工具和技巧,机器学习中最常见的优化当属凸优化了,这些可以参考Ng的教学资料:http://cs229.stanford.edu/section/cs229-cvxopt.pdf,从中我们可以大致了解到一些凸优化的概念,比如凸集,凸函数,凸优化问题,线性规划,二次规划,二次约束二次规划,半正定规划等,从而对凸优化问题有个初步的认识。以下是几个重要相关概

2016-03-29 16:07:15 510

转载 K-means分类

K-means聚类算法     K-means也是聚类算法中最简单的一种了,但是里面包含的思想却是不一般。最早我使用并实现这个算法是在学习韩爷爷那本数据挖掘的书中,那本书比较注重应用。看了Andrew Ng的这个讲义后才有些明白K-means后面包含的EM思想。     聚类属于无监督学习,以往的回归、朴素贝叶斯、SVM等都是有类别标签y的,也就是说样例中已经给出了样例的分类。而聚

2016-03-22 09:58:37 5778

转载 中文分词算法

中文分词算法现在一般分为三类:基于字符串匹配,基于理解,基于统计的分词。基于字符串匹配分词:机械分词算法。将待分的字符串与一个充分大的机器词典中的词条进行匹配。分为正向匹配和逆向匹配;最大长度匹配和最小长度匹配;单纯分词和分词与标注过程相结合的一体化方法。所以常用的有:正向最大匹配,逆向最大匹配,最少切分法。。。实际应用中,将机械分词作为初分手段,利用语言信息提高切分准确率。优先识别具有明

2016-03-22 09:28:01 428

转载 各种分类算法比较

1决策树(Decision Trees)的优缺点决策树的优点:1)决策树易于理解和解释.人们在通过解释后都有能力去理解决策树所表达的意义。2)决策树是一个白盒模型。如果给定一个观察的模型,那么根据所产生的决策树很容易推出相应的逻辑表达式。3)在相对短的时间内能够对大型数据源做出可行且效果良好的结果。决策树的缺点:1)对于那些各类别样本数量不一致的数据

2016-03-21 21:17:56 777

转载 线程和进程

线程与进程的区别归纳:a.地址空间和其它资源:进程间相互独立,同一进程的各线程间共享。某进程内的线程在其它进程不可见。b.通信:进程间通信IPC,线程间可以直接读写进程数据段(如全局变量)来进行通信——需要进程同步和互斥手段的辅助,以保证数据的一致性。c.调度和切换:线程上下文切换比进程上下文切换要快得多。d.在多线程OS中,进程不是一个可执行的实体。

2016-03-21 20:58:10 255

转载 MySQL事务隔离级别(脏读,不可重复读,幻象读)

1.事务里一些有问题的读取:脏读,不可重复读,幻象读脏读 (dirty read)事务T1更新了一行记录的内容,但是并没有提交所做的修改。事务T2读取更新后的行,然后T1执行回滚操作,取消了刚才所做的修改。现在T2所读取的行就无效了。不可重复读取 (nonrepeatable read)事务T1读取一行记录,紧接着事务T2修改 了T1刚才读取的那一行记录。然后T1又再次读取这行记录

2016-03-21 20:53:54 384

翻译 OSI分层结构

OSI将计算机网络体系结构(architecture)划分为以下七层:物理层: 将数据转换为可通过物理介质传送的电子信号 相当于邮局中的搬运工人数据链路层: 决定访问网络介质的方式在此层将数据分帧,并处理流控制。本层 指定拓扑结构并提供硬件寻 址。相当于邮局中的装拆箱工人网络层: 使用权数据路由经过大型网络 相当于邮局中的排序工人传输层:

2016-03-19 22:33:06 796

翻译 事务的四大特点

事务(Transaction)是并发控制的单位,是用户定义的一个操作序列。这些操作要么都做,要么都不做,是一个不可分割的工作单位。通过事务,SQL Server能将逻辑相关的一组操作绑定在一起,以便服务器保持数据的完整性。事务通常是以BEGIN TRANSACTION开始,以COMMIT或ROLLBACK结束。COMMIT表示提交,即提交事务的所有操作。具体地说就是将事务中所有对数据库的更新写

2016-03-19 22:29:56 426

转载 数据库操作语言有哪两大部分功能

数据库 有DML和DDL两大操作语言,还有个DCL。DML(data manipulation language):是对数据库的SELECT、UPDATE、INSERT、DELETE,这4条命令是用来对数据库里的数据进行增删改查操作操作的语言。DDL(data definition language):DDL比DML要多,主要的命令有CREATE、ALTER、DROP等,DDL

2016-03-19 22:26:28 963

转载 哈希表的C++实现

哈希表的几个概念:映像:由哈希函数得到的哈希表是一个映像。冲突:如果两个关键字的哈希函数值相等,这种现象称为冲突。处理冲突的几个方法:1、开放地址法:用开放地址处理冲突就是当冲突发生时,形成一个地址序列,沿着这个序列逐个深测,直到找到一个“空”的开放地址,将发生冲突的关键字值存放到该地址中去。例如:hash(i)=(hash(key)+d(i)) MOD m

2016-03-19 22:22:40 380

转载 const, static, const static

const定义的常量在函数执行之后其空间会被释放,而static定义的静态常量在函数执行后不会被释放其空间。static 表示的是静态的。类的静态成员函数,成员变量是和类相关的,不是和类的具体对象相关,即使没有具体的对象,也能调用类的静态成员函数,成员变量。一般的静态函数几乎就是一个全局函数,只不过它的作用域限于包含它的文件中。 在c++中,static静态成员变量不能在类内部

2016-03-19 21:52:26 313

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除