计算广告与机器学习-技术共享平台

计算广告与机器学习博客地址:http://www.52caml.com/大家好,欢迎来到CAML-技术共享平台!CAML平台致力于整理和分享互联网广告领域的核心问题和解决方案。博主水平有限,期望能与对此话题感兴趣的朋友一起学习、交流、探讨与分享。众所周知,机器学习是一门交叉性很强的学科,而我们这里...

2016-03-29 09:09:00

阅读数 1606

评论数 0

一些代码20140717

################################################## #主程序逻辑 #select data # select_hive_sql通过查询语句向表中插入数据,这里使用了OVERWRITE关键字,因此之前分区中的内容会被覆盖掉。 # 如果没有OV...

2014-07-18 00:37:07

阅读数 547

评论数 0

1. awk, gawk命令使用

简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。 awk有3个不同版本: awk、nawk和gawk,未作特别说明,...

2014-07-15 19:15:31

阅读数 4014

评论数 0

1. 【Java基础】jar, javac, java的具体使用方法

Jar:用法:jar {ctxui}[vfm0Me] [jar 档案] [清单档案] [进入点] [-C 目录] 档案 ... 选项: -c 建立新的归档 -t 列出归档的目录 -x 从归档中撷取已命名的 (或所有) 档案 -u 更新现有归档 -v ...

2014-07-15 16:16:32

阅读数 541

评论数 0

Linux错误集锦

1. [Errno 14] PYCURL ERROR 7 - "couldn't connect to host"  本机在服务器上的一个节点用

2014-05-14 09:33:17

阅读数 626

评论数 0

python/sklearn/theano中随机数总结

Python中的随机数生成器在numpy.random下面 1. 生成910*4

2014-05-08 15:15:39

阅读数 1343

评论数 0

【deep learning】Theano文档学习

1. thenao中的共享共享变量总结: import theano import theano.tensor as T from theano import function from theano import shared state = shared(200) # 使用shared定义...

2014-05-08 15:05:05

阅读数 1921

评论数 0

python文本处理总结

1. 除去字符串中,不需要的字符,只要有用的

2014-05-03 16:17:49

阅读数 2789

评论数 0

One-hot编码:Python sklearn CTR实验

import numpy as np from sklearn.preprocessing import OneHotEncoder from numpy import * import MySQLdb conn = MySQLdb.connect(host='localhost', user...

2014-05-03 15:10:23

阅读数 4296

评论数 0

Python与Mysql之间的操作MySQLdb

MySQLdb是python用于连接并与mysql数据,

2014-05-03 10:25:03

阅读数 1304

评论数 0

玩转机器学习目标函数

机器学习中的目标函数,哟

2014-05-01 17:00:32

阅读数 2336

评论数 0

sklearn.metrics中的评估方法介绍

1. sklearn.metrics.auc(x, y, reorder=False): 计算AUC值,其中x,y分别为数组形式,

2014-04-30 17:06:36

阅读数 24623

评论数 1

PR,ROC,AUC计算方法

受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而...

2014-04-30 16:53:21

阅读数 2550

评论数 0

ROC、AUC、PR等计算方法

受试者工作特征曲线 (receiver operating characteristic curve,简称ROC曲线),又称为感受性曲线(sensitivity curve)。得此名的原因在于曲线上各点反映着相同的感受性,它们都是对同一信号刺激的反应,只不过是在几种不同的判定标准下所得的结果而...

2014-04-30 16:18:40

阅读数 5679

评论数 0

windows安装pip

1、添加python的环境变量 path = C:\Python27 此步骤可实现在命令行下,不用进入 Python 目录即可执行 python.exe 2、下载 setuptools 注意对应 Python 的版本,完成后运行 exe 即可完成安装 setuptools-0...

2014-04-27 09:53:34

阅读数 585

评论数 0

1. 回归

scikit-learn中关于回归有好多方法 1.

2014-04-25 10:22:10

阅读数 1149

评论数 0

Python错误集锦

1. centos更新到python2.7时,无法正常使用方向键: zhuy

2014-04-25 08:07:15

阅读数 22324

评论数 4

0.python:scikit-learn基本用法

经Edwin Chen的推荐,认识了scikit-learn这个非常强大的python机器学习工具包。这个帖子作为笔记。(其实都没有笔记的意义,因为他家文档做的太好了,不过还是为自己记记吧,为以后节省若干分钟)。如果有幸此文被想用scikit-learn的你看见,也还是非常希望你去它们的主页看文档...

2014-04-24 19:25:23

阅读数 1907

评论数 0

Python机器学习工具箱

Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy。其中Numpy是一个用python实现的科学计算包。包括: 一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、傅里叶变换和随机数生成函数...

2014-04-24 16:28:02

阅读数 1117

评论数 0

第1章:Python基本对象

1. 字符串 str(), repr(), format()可以将非字符串值转化为字符串形式,例如 x = 3.4 print str(x)  # 输出 '3.4' print format(x, '0.5f')   # 输出'3.40000' name = raw_input('pl...

2014-04-23 22:46:47

阅读数 526

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭