自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(86)
  • 资源 (1)
  • 收藏
  • 关注

原创 计算广告与机器学习-技术共享平台

计算广告与机器学习博客地址:http://www.52caml.com/大家好,欢迎来到CAML-技术共享平台!CAML平台致力于整理和分享互联网广告领域的核心问题和解决方案。博主水平有限,期望能与对此话题感兴趣的朋友一起学习、交流、探讨与分享。众所周知,机器学习是一门交叉性很强的学科,而我们这里主要想分享和探讨的是如何利用机器学习这把利器,有效地解决在线广告领域中的学习问题 ...

2016-03-29 09:09:00 2112

原创 一些代码20140717

###################################################主程序逻辑#select data# select_hive_sql通过查询语句向表中插入数据,这里使用了OVERWRITE关键字,因此之前分区中的内容会被覆盖掉。# 如果没有OVERWRITE或者使用INTO关键字替换掉它的话,Hive会以追加的方式写入数据而不会覆盖掉之前已经存

2014-07-18 00:37:07 743

转载 1. awk, gawk命令使用

简介awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk,gawk 是 AWK 的 GNU 版本。awk其名称得自于它的创始人 Alfr

2014-07-15 19:15:31 5218

转载 1. 【Java基础】jar, javac, java的具体使用方法

Jar:用法:jar {ctxui}[vfm0Me] [jar 档案] [清单档案] [进入点] [-C 目录] 档案 ...选项: -c 建立新的归档 -t 列出归档的目录 -x 从归档中撷取已命名的 (或所有) 档案 -u 更新现有归档 -v 在标准输出中产生详细输出 -f 指定归档档案名称 -m 包含指定清单档案中的清单

2014-07-15 16:16:32 701

原创 Linux错误集锦

1. [Errno 14] PYCURL ERROR 7 - "couldn't connect to host" 本机在服务器上的一个节点用

2014-05-14 09:33:17 765

原创 python/sklearn/theano中随机数总结

Python中的随机数生成器在numpy.random下面1. 生成910*4

2014-05-08 15:15:39 1471

原创 【deep learning】Theano文档学习

1. thenao中的共享共享变量总结:import theanoimport theano.tensor as Tfrom theano import functionfrom theano import sharedstate = shared(200) # 使用shared定义共享变量,初始化为200inc = T.iscalar('inc')# 定义累加器accumul

2014-05-08 15:05:05 2104

原创 python文本处理总结

1. 除去字符串中,不需要的字符,只要有用的

2014-05-03 16:17:49 3204

原创 One-hot编码:Python sklearn CTR实验

import numpy as npfrom sklearn.preprocessing import OneHotEncoderfrom numpy import *import MySQLdbconn = MySQLdb.connect(host='localhost', user='root', passwd='Zhouy2008', port = 3306)cursor =

2014-05-03 15:10:23 4583

原创 Python与Mysql之间的操作MySQLdb

MySQLdb是python用于连接并与mysql数据,

2014-05-03 10:25:03 1494

原创 玩转机器学习目标函数

机器学习中的目标函数,哟

2014-05-01 17:00:32 3043

原创 sklearn.metrics中的评估方法介绍

1. sklearn.metrics.auc(x, y, reorder=False):计算AUC值,其中x,y分别为数组形式,

2014-04-30 17:06:36 29046 3

转载 PR,ROC,AUC计算方法

受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚报概率为横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采

2014-04-30 16:53:21 3598

转载 ROC、AUC、PR等计算方法

受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而已。接受者操作特性曲线就是以虚报概率为横轴,击中概率为纵轴所组成的坐标图,和被试在特定刺激条件下由于采

2014-04-30 16:18:40 8001

转载 windows安装pip

1、添加python的环境变量path = C:\Python27此步骤可实现在命令行下,不用进入 Python 目录即可执行 python.exe2、下载 setuptools注意对应 Python 的版本,完成后运行 exe 即可完成安装setuptools-0.6c11.win32-py2.7.exehttp://pypi.python.org/pypi/

2014-04-27 09:53:34 702

原创 1. 回归

scikit-learn中关于回归有好多方法1.

2014-04-25 10:22:10 1281

原创 Python错误集锦

1. centos更新到python2.7时,无法正常使用方向键:zhuy

2014-04-25 08:07:15 25256 4

转载 0.python:scikit-learn基本用法

经Edwin Chen的推荐,认识了scikit-learn这个非常强大的python机器学习工具包。这个帖子作为笔记。(其实都没有笔记的意义,因为他家文档做的太好了,不过还是为自己记记吧,为以后节省若干分钟)。如果有幸此文被想用scikit-learn的你看见,也还是非常希望你去它们的主页看文档。主页中最值得关注的几个部分:User Guide几乎是machine learning的索引,各

2014-04-24 19:25:23 2096

转载 Python机器学习工具箱

Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅里叶变换和随机数生成函数。     SciPy是一个开源的Python算法库和数学工具包,SciPy包含的模块有最优化

2014-04-24 16:28:02 1979

原创 第1章:Python基本对象

1. 字符串str(), repr(), format()可以将非字符串值转化为字符串形式,例如x = 3.4print str(x) # 输出 '3.4'print format(x, '0.5f')   # 输出'3.40000'name = raw_input('please input your name:')# 在Python3中,raw_input()函数叫

2014-04-23 22:46:47 634

转载 centos 安装numpy,scipy,scikit-learn

之前需要下载numpyCentOSにpython 2.7.3をインストールする手順CentOS 6.3にPython 2.7.3をインストールしてひと通りの環境を整える手順を書きます。Python 2.7.3のインストールcd srcwget http://www.python.org/ftp/python/2.7.3/Python-2.7.3.tgztar zxv

2014-04-23 13:16:46 1685

转载 deb包转化成rpm包

转载▼  deb文件格式本是ubuntu的安装文件,那么我想要在fedora中安装,需要把deb格式转化成rpm格式,我们用skype举例:1.下载转换工具alien_8.78.tar.gz2.deb转化成rpm例:我们要安装skype-debian_2.0.0.68-1_i386.deb1.下载 alien_8.78

2014-04-23 10:12:14 2745

转载 计算广告学 学习资料

学习课程计算广告学 - 刘鹏     http://study.163.com/course/introduction.htm?courseId=321007#/courseDetail第一期百度计算广告学沙龙     http://www.youku.com/playlist_show/id_20672162.html第二期百度计算广告学沙龙

2014-02-06 20:59:12 1031

转载 深度学习 学习资料

深度学习,是当前热门的机器学习领域。 最近开始想系统学习一下, 整理了一些网上学习资料, 也供有共同兴趣的朋友参考。如果有好的推荐,也欢迎给我留言。学习网站1. Deep Learning 101    http://markus.com/deep-learning-101/?utm_campaign=Manong_Weekly_Issue_11&utm_med

2014-02-06 20:56:55 1310

转载 boost安装(本机是为了安装 机器学习工具包shark,而安装boost的)

windows下boost怎样安装与使用说明?安装VS2010第1步:先从官网(www.boost.org)下载最新版的BOOST源码,如图所示随便下哪个都行,我这里下的是82M的那个第2步:编译源代码(放心.这里是傻瓜式的操作,很容易操作)(本机下载的是boost_1_55_0.zip, zhouy)(1)先把源代码放在D盘,例如 D:\InstalledPr

2014-01-05 09:45:41 1290

转载 机器学习那些事

[转载]机器学习的那些事已有 2254 次阅读 2012-12-25 11:49 |个人分类:计算机科学|系统分类:论文交流|关键词:机器学习【原题】A Few Useful Things to Know About Machine Learning【译题】机器学习的那些事【作者】Pedro Domingos【译者】刘知远【说明】译文载于《中国计算机学会通讯》 第 

2013-12-26 08:51:04 1634

转载 开源机器学习库

原文地址:C++的机器学习开源库作者:webbery508 一、c++开源机器学习库1)mlpack is a C++ machine learning library.2)PLearn is a C++ library aimed at research and development in the field of statistical machine learn

2013-12-23 18:49:25 1891

转载 大牛们的blog (人工智能与机器学习)

大牛们的blog (人工智能与机器学习)国外人工智能界牛人主页以前转过一个计算机视觉领域内的牛人简介,现在转一个更宽范围内的牛人简介:http://people.cs.uchicago.edu/~niyogi/http://www.cs.uchicago.edu/people/http://pages.cs.wisc.edu/~jerryzhu/

2013-12-23 18:14:30 1819

原创 R for Centos安装步骤

转载地址:http://blog.sina.com.cn/s/blog_551d7bff0101423f.html由于希望在Hadoop集群上配置RHadoop,自然需要在每个服务器节点上安装R语言。在安装过程也碰到了一些小问题,因此记录一下。    首先服务器系统版本为centos5.6,R版本为2.13.2。下面是安装步骤:    首先上传文件:rz -e

2013-12-16 16:25:29 1817

转载 *.tar.gz文件包安装

linux tar.gz安装方法 转载地址: http://baile8410.iteye.com/blog/546517linux下解压tar.gz文件 下面所所有操作,后面有所有步骤说明 [yonghu@localhost ~]#       su root 口令:                                       [root@localhos

2013-12-16 15:47:06 936

转载 统计机器学习的理解

目前机器学习的一个比较热门的方向是统计机器学习(另外一个可能是图模型,按照Jordan的说法是统计机器学习属于频率主义,而图模型属于贝叶斯主 义), 对于每一个做统计机器学习的研究者来说,他们大致可以分为两类:一类做统计学习理论相关工作,如泛化界、约简或一致性;一类做优化算法,如支持向量机、 Boosting等。作为一个纯统计机器学习的学者来说,我想这两块内容都得了解。优化算法的门槛低点,可能比较

2013-12-13 11:15:58 1139 1

原创 数据挖掘/分析前的数据整理方法

这里谈不上数据预处理方法,只是数据的导入、导出,以及格式的转换、(一或多个)分隔符等相关问题1. 一条样本/记录中含有多个分隔符的处理方法:(1). 对于小数据集一个有效的方法是: ① 将有多个分隔符的数据 复制 到word文章,将多个分隔符转化为同一个分隔符;② 开始 ---> 查找替换 ---> 替换 ---> 查找内容(如果是空格,直接按一下空格键;如果是制表符等需要使用

2013-12-11 21:06:41 1569

原创 [MOOC学习笔记]机器学习基石 Lecture02 Learning to Answer Yes/No

最近,Cousera公开课上又多了一门优质的ML课程,尤其对于华语圈的朋友是学习机器学习的福音。由于本人之前对ML有一定的学习和理解,所以从一个观察者or评论者的角度,来看林老师讲的ML课程,客观的评价是,讲的非常清楚,没有国内大学ML相关课程的照本宣科,问题的引入、算法的描述以及推理都很清楚,非常值得好好学习,不管是刚接触ML的朋友,还是有一定ML经验的朋友。本次Machine Lear

2013-12-07 23:09:25 1312 1

原创 [MOOC学习笔记]机器学习基石 Lecture01 The Learning Problem

1. 首先:关于ML的几个解读ML:acquiring skill with experience accumulated/computed from data.skill improve some performance measure(e.g. prediction accuracy)ML: improving some performance measure with expe

2013-11-27 16:14:05 1785

转载 R语言与数据挖掘学习笔记(常用的包)

今天发现一个很不错的博客(http://www.RDataMining.com), 博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静。决定从今天 开始,只要晚上能在11点之前把碗洗好,就花一个小时的时间学习博客上的内容,并把学习过程中记不住的信息记录下来,顺便把离英语四级的差距尽量缩小。下面列出了可用于

2013-11-27 13:50:43 1102

转载 基于VRM(访问者关系管理)的RTB(实时竞价)

凌晨,梦芭莎精准营销总监。2006年至2007年从事B/S结构程序开发工作;2008年正式投身网络营销的研究及其相关实践与应用;2010年进入梦芭莎参与企业级别的搜索营销工作;现阶段工作主要以大数据为基础,整合SEO、SEM、RTB来推动精准化网络营销,从而达到增强用户体验、积淀品牌影响力、和提高流量转化率的效果。希望能够与更多的同行交流关于精准营销话题,QQ:68590459。—————

2013-11-27 13:49:02 1719

转载 强化学习算法介绍(Reinforcement Learning and Control)

在之前的讨论中,我们总是给定一个样本x,然后给或者不给label y。之后对样本进行拟合、分类、聚类或者降维等操作。然而对于很多序列决策或者控制问题,很难有这么规则的样本。比如,四足机器人的控制问题,刚开始都不知道应该让其动那条腿,在移动过程中,也不知道怎么让机器人自动找到合适的前进方向。另外如要设计一个下象棋的AI,每走一步实际上也是一个决策过程,虽然对于简单的棋有A*的启发式方法,但在

2013-11-27 13:47:40 9434

原创 R技术、函数知识点总结

1. rbind(), cbind():  构造、合并vector 或matrix为一个矩阵:cbind(1, 1:10) ----默认列合并, rbind(1, 1:10) ----行合并(or构造)

2013-11-26 19:41:31 8082

原创 Deep Learning学习网站

算法组: http://deeplearning.suanfazu.com/blog/

2013-11-23 23:24:33 961

转载 机器学习经典论文

源地址: http://suanfazu.com/discussion/68/机器学习经典论文survey合集#0-tsina-1-13801-397232819ff9a47a7b7e80a40613cfe1感谢分享Active LearningTwo Faces of Active Learning, Dasgupta, 2011Active Learning

2013-11-23 23:22:49 3341

面向对象设计方法

软件工程 面向对象 设计方法 主要描述的是 面向用例实现方案

2012-09-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除