2017年10月_窝头就辣椒

10月 09月 08月 05月 03月

原创 plsql安装与配置

如果你在工作当中会使用到oracle做数据库，那么一个便于使用sql工具是必不可少的；oracle官方推荐工具是sql developer，但是在工作中发现用着工具的几乎没有，接触过几个负责oracle的dba，他们大都倾向于使用plsql,虽然在开始的时候我不知道这是为什么？但是他们推荐我也就放弃sql developer,改为plsql了，plsql虽然看着界面不是那么美观，但熟练之后还是非常

2017-10-11 22:04:43 1960

机器学习实战彩版高清PDF及全书源码、使用数据集

机器学习实战彩版高清PDF及全书源码、测试使用数据集。自己好不容易搞到的这么清晰的文档，源码是基于python2.7的，也是搜了好久才查找到的,自己也在看这本书，希望能给帮助到大家第1章机器学习基础..................................... 2 1.1 何谓机器学习 ............................................ 3 1.1.1 传感器和海量数据 ......................... 4 1.1.2 机器学习非常重要 ......................... 5 1.2 关键术语 .................................................... 5 1.3 机器学习的主要任务 ................................. 7 1.4 如何选择合适的算法 ................................. 8 1.5 开发机器学习应用程序的步骤 ................. 9 1.6 Python语言的优势.................................. 10 1.6.1 可执行伪代码 ............................... 10 1.6.2 Python比较流行.......................... 10 1.6.3 Python语言的特色....................... 11 1.6.4 Python语言的缺点....................... 11 1.7 NumPy函数库基础................................. 12 1.8 本章小结 .................................................. 13 第2章 k-近邻算法 ....................................... 15 2.1 k-近邻算法概述....................................... 15 2.1.1 准备：使用Python导入数据...... 17 2.1.2实施kNN算法............................. 19 2.1.3 如何测试分类器 ........................... 20 2.2 示例：使用k-近邻算法改进约会网站的配对效果.............................................. 20 2.2.1 准备数据：从文本文件中解析数据.............................................. 21 2.2.2 分析数据：使用Matplotlib创建散点图...................................... 23 2.2.3 准备数据：归一化数值 ............... 25 2.2.4 测试算法：作为完整程序验证分类器.......................................... 26 2.2.5 使用算法：构建完整可用系统.............................................. 27 2.3 示例：手写识别系统 .............................. 28 2.3.1 准备数据：将图像转换为测试向量.......................................... 29 2.3.2 测试算法：使用k-近邻算法识别手写数字.............................. 30 2.4 本章小结 .................................................. 31 第3章决策树 ............................................... 32 3.1 决策树的构造 .......................................... 33 3.1.1信息增益...................................... 35 3.1.2 划分数据集 .................................. 37 3.1.3 递归构建决策树 ........................... 39 3.2在Python中使用Matplotlib注解绘制树形图..................................................... 42 3.2.1 Matplotlib注解............................ 43 3.2.2 构造注解树 .................................. 44 3.3 测试和存储分类器 .................................. 48 3.3.1 测试算法：使用决策树执行分类.............................................. 49 3.3.2 使用算法：决策树的存储 ........... 50 3.4 示例：使用决策树预测隐形眼镜类型 .... 50 3.5 本章小结 .................................................. 52 第4章基于概率论的分类方法：朴素贝叶斯 ............................................... 53 4.1 基于贝叶斯决策理论的分类方法 ........... 53 4.2 条件概率 .................................................. 55 4.3 使用条件概率来分类 .............................. 56 4.4 使用朴素贝叶斯进行文档分类 ............... 57 4.5使用Python进行文本分类..................... 58 第1章机器学习基础..................................... 2 1.1 何谓机器学习 ............................................ 3 1.1.1 传感器和海量数据 ......................... 4 1.1.2 机器学习非常重要 ......................... 5 1.2 关键术语 .................................................... 5 1.3 机器学习的主要任务 ................................. 7 1.4 如何选择合适的算法 ................................. 8 1.5 开发机器学习应用程序的步骤 ................. 9 1.6 Python语言的优势.................................. 10 1.6.1 可执行伪代码 ............................... 10 1.6.2 Python比较流行.......................... 10 1.6.3 Python语言的特色....................... 11 1.6.4 Python语言的缺点....................... 11 1.7 NumPy函数库基础................................. 12 1.8 本章小结 .................................................. 13 第2章 k-近邻算法 ....................................... 15 2.1 k-近邻算法概述....................................... 15 2.1.1 准备：使用Python导入数据...... 17 2.1.2实施kNN算法............................. 19 2.1.3 如何测试分类器 ........................... 20 2.2 示例：使用k-近邻算法改进约会网站的配对效果.............................................. 20 2.2.1 准备数据：从文本文件中解析数据.............................................. 21 2.2.2 分析数据：使用Matplotlib创建散点图...................................... 23 2.2.3 准备数据：归一化数值 ............... 25 2.2.4 测试算法：作为完整程序验证分类器.......................................... 26 2.2.5 使用算法：构建完整可用系统.............................................. 27 2.3 示例：手写识别系统 .............................. 28 2.3.1 准备数据：将图像转换为测试向量.......................................... 29 2.3.2 测试算法：使用k-近邻算法识别手写数字.............................. 30 2.4 本章小结 .................................................. 31 第3章决策树 ............................................... 32 3.1 决策树的构造 .......................................... 33 3.1.1信息增益...................................... 35 3.1.2 划分数据集 .................................. 37 3.1.3 递归构建决策树 ........................... 39 3.2在Python中使用Matplotlib注解绘制树形图..................................................... 42 3.2.1 Matplotlib注解............................ 43 3.2.2 构造注解树 .................................. 44 3.3 测试和存储分类器 .................................. 48 3.3.1 测试算法：使用决策树执行分类.............................................. 49 3.3.2 使用算法：决策树的存储 ........... 50 3.4 示例：使用决策树预测隐形眼镜类型 .... 50 3.5 本章小结 .................................................. 52 第4章基于概率论的分类方法：朴素贝叶斯 ............................................... 53 4.1 基于贝叶斯决策理论的分类方法 ........... 53 4.2 条件概率 .................................................. 55 4.3 使用条件概率来分类 .............................. 56 4.4 使用朴素贝叶斯进行文档分类 ............... 57 4.5使用Python进行文本分类..................... 58

2019-02-21

谷歌发表的关于Goods的论文，高清英文原版

Goods: Organizing Google’s Datasets Alon Halevy 2 , Flip Korn 1 , Natalya F. Noy 1 , Christopher Olston 1 , Neoklis Polyzotis 1 , Sudip Roy 1 , Steven Euijong Whang 1 1 Google Research 2 Recruit Institute of Technology [email protected], {flip, noy, olston, npolyzotis, sudipr, swhang}@google.com 1. INTRODUCTION Most large enterprises today witness an explosion in the number of datasets that they generate internally for use in ongoing research and development. The reason behind this explosion is simple: by allowing engineers and data scientists to consume and generate datasets in an unfettered manner, enterprises promote fast development cycles, experimentation, and ultimately innovation that drives their competitive edge. As a result, these internally generated datasets often become a prime asset of the company, on par with source code and internal infrastructure. However, while enterprises have developed a strong culture on how to manage the latter, with source-code development tools and methodologies that we now consider “standard” in the industry (e.g., code versioning and indexing, reviews, or testing), similar approaches do not generally exist for managing datasets. We argue that developing principled and flexible approaches to dataset management has become imperative, lest companies run the risk of internal siloing of datasets, which, in turn, results in significant losses in productivity and opportunities, duplication of work, and mishandling of data

2019-02-21

mfc42d.dll与msvcrtd.dll

这两个dll文件呢，是我在打包c++软件时发现他俩的珍贵的，其实我们在安装软件是也会缺少这两个dll文件的情况，此时，你只需要把这两个文件拷贝到系统的指定位置，然后注册就好了。可是有时候系统明明不缺少这两个文件，就是安装完软件后出现这样的错误，这种情况就是软件的问题了，一般的个人开发软件，特别是c++编译好的软件开发者在调试时debug里面的可执行文件会自动调用vc环境中的这两个dll文件，可是当把软件打包后放到另外一台电脑时，执行文件找不到这两个dll文件，就出现错误了。此时呢，开发者应该把这两个文件放到你的软件源码的文件夹了，然后一起打包，之后完成的不管是安装文件，或可执行文件都不会出错了

2013-10-05

cdh hadoop mapreduce 运行时的问题：（有时候会出现，有时候不出现，急求大神帮助）

2015-10-08

TA创建的收藏夹 TA关注的收藏夹

TA关注的人