大数据入门
文章平均质量分 84
Dr_David_S
阿里巴巴码农,主要做做NLP业务,兴趣是投资理财。
展开
-
Python数据分析工具
Python大数据工具简介原创 2016-08-22 01:25:46 · 1934 阅读 · 0 评论 -
第二章 K-近邻算法 及 手写识别系统
这一节主要是手写识别数字系统的搭建。实际训练数据在 trainingDigits 里面,大约2000个例子。为了使用之前 2.2 的分类器,要把图像格式化处理为一个向量,32*32 变成 1* 1024。首先写一个 img2vector 函数,打开给定文件,循环读出前32行,然后把每行的头32个字符存在 NumPy 数组里面,最后返回数组。这个片段加在之前 kNN.py 里面。de原创 2016-12-10 11:14:07 · 629 阅读 · 0 评论 -
3.1 数据质量分析
这是书籍《Python数据分析与挖掘实战》里面第3.1节的一些实践。理论废话就不讲了,主要是程序代码、调试报错以及结果记录,附带一些心得。首先说明,数据是书里面网站自带的。http://pan.baidu.com/s/1kVK2M39 这是下载地址。密码要的请评论问。原创 2016-12-05 09:19:46 · 3554 阅读 · 1 评论 -
3.2 -3.4 数据特征分析
针对菜品销量的数据特征的分析原创 2016-12-05 10:01:16 · 1666 阅读 · 0 评论 -
4.1-4.3 数据预处理-清洗-变换-离散化
数据的预处理,包括清洗,集成,变换等等。原创 2016-12-07 09:40:09 · 4151 阅读 · 0 评论