自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (4)
  • 收藏
  • 关注

原创 机器学习之决策树

一.决策树模型和学习 1.决策树定义 决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。 2.决策树的学习构造决

2017-06-26 02:00:00 834

转载 hadoop学习笔记

hadoop学习笔记

2017-06-20 11:39:31 230

原创 常用函数

读取文件 ‘kmeans_test_1.txt’ 文件内容1.658985 4.285136 -3.453687 3.424321(1) read(size)函数:一次性读取文件所有的内容 , 或者对应字节数的内容fr = open('kmeans_test_1.txt','r')print(fr.read()) print(type(fr.read()))##运行结果 1.658985

2017-06-05 17:03:59 204

原创 聚类算法

机器学习中有两类的大问题,一个是分类,一个是聚类。分类是根据一些给定的已知类别标号的样本,训练某种学习机器,使它能够对未知类别的样本进行分类。这属于supervised learning(监督学习)。而聚类指事先并不知道任何样本的类别标号,希望通过某种算法来把一组未知类别的样本划分成若干类别,这在机器学习中被称作 unsupervised learning (无监督学习)。 1、定义: 所谓聚类问

2017-06-03 17:54:19 643

原创 linux基本命令

学过的东西不用真的很容易忘记,之前用虚拟机的时候看得兄弟连沈超老师视频做的笔记,写在印象笔记上的。后来不怎么使用linux就把这都给还给老师了。最近因为tensorflow又开始使用ubuntu,所以再试着捡回来。。[root@localhost~]# panxie@panxie-hp-notebook:~$其中: root 当前登陆用户名 localhost 主机名 ~

2017-06-02 11:27:17 299

A Brief Introduction to PySpark

关于 PySpark 的简介,适合新手入门学习。PySpark is a great language for performing exploratory data analysis at scale, building machine learning pipelines, and creating ETLs for a data platform. If you’re already familiar with Python and libraries such as Pandas, then PySpark is a great language to learn in order to create more scalable analyses and pipelines. The goal of this post is to show how to get up and running with PySpark and to perform common tasks.

2019-04-14

隐马尔可夫模型教程-Oxford

牛津大学关于隐马尔可夫模型的详细教程~oxford hidden markov model tutorial

2018-04-12

贝叶斯网络

香港中文科技大学,关于贝叶斯网络的详细教程,非常有用。

2018-04-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除