
ML
216549856
这个作者很懒,什么都没留下…
展开
-
入门NLP-task2-数据探索
title: 入门NLP-task2-数据探索date: 2020-07-22 20:31:57tags: [‘NLP’, ‘自然语言处理’]categories: ‘自然语言处理’–真的没有图片–非结构化数据的数据探索不像结构化数据,结构化数据可以通过数据探索得到很多有用的信息,非结构化数据的数据探索得到的信息有限。仅仅能够得到字符出现的频率、次数,新闻的长度等等先观察新闻长度train_df['text_len'] = train_df['text'].apply(lambda x:.原创 2020-07-22 21:48:00 · 313 阅读 · 0 评论 -
独热编码——One-Hot Encoding
One-Hot Encoding介绍又称为一位有效编码,用N位状态寄存器来对N个状态进行编码,每个状态都由独立的寄存器表示,其中只有一位有效。对于1, 2, 3,经过独热编码后为001,010,100应用对于有些特征变量可能是属性变量,如color:[‘red’,‘blue’,‘green’]我们就要把这个color特征变量编码为数字。我们可编码为[1,2,3]。但是这样的编码...原创 2019-06-01 18:48:36 · 622 阅读 · 0 评论 -
吴恩达《机器学习》——第七次作业:主要成分分析(PCA)
import numpy as npimport matplotlib.pyplot as pltfrom scipy.io import loadmatdata = loadmat('data/ex7data1.mat')X = data['X']fig, ax = plt.subplots(figsize=(12, 8))ax.scatter(X[:, 0], X[:, 1])...原创 2019-05-27 14:02:57 · 703 阅读 · 0 评论 -
吴恩达《机器学习》——第七次作业:k-means算法
2D-kmeans算法import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport seaborn as sbfrom scipy.io import loadmatdef find_closet_centroids(X, centroids): '''将每个特征计算属于那个特征''...原创 2019-05-25 18:22:55 · 935 阅读 · 0 评论 -
吴恩达《机器学习》——第四次作业:BP神经网络
本此作业和上次作业的目标一样,属于多元分类任务。不过这次是使用BP神经网络。准确度比没有使用神经网络的第三次作业要高,但是训练的时间也长了很多。参考:https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes/tree/master/codeimport matplotlib.pyplot as pltimport numpy as npi...原创 2019-05-18 19:33:25 · 1589 阅读 · 0 评论 -
吴恩达《机器学习》——第三次作业:多元分类
写了好长时间的驼峰命名,最近有点恶心了,决定python用下划线,C++用驼峰。这次作业是对手写数字的数据集进行训练。多元分类的一个任务。参考:https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes/tree/master/codeimport matplotlib.pyplot as pltimport numpy as npim...原创 2019-05-18 16:47:23 · 908 阅读 · 1 评论 -
用神经网络实现异或运算
import numpy as npclass Logistic(): def __init__(self): pass def sigmoid(self, z): '''激活函数''' return 1 / (1 + np.exp(-z)) def logistic(self, X, theta): ...原创 2019-05-14 16:03:12 · 3702 阅读 · 0 评论 -
吴恩达《机器学习》第二次作业——逻辑回归
逻辑回归给的数据集有两个特征变量。设想你是大学相关部分的管理者,想通过申请学生两次测试的评分,来决定他们是否被录取。现在你拥有之前申请学生的可以用于训练逻辑回归的训练样本集。对于每一个训练样本,你有他们两次测试的评分和最后是被录取的结果。由此建立逻辑回归分类器。注: https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes/tree/m...原创 2019-05-10 10:51:24 · 1235 阅读 · 2 评论 -
吴恩达《机器学习》第一次作业——多变量线性回归
看这里 https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes/tree/master/code这是一位大神整理的作业代码。我也就是照葫芦画瓢,慢慢来吧。import numpy as npimport pandas as pdimport matplotlib.pyplot as pltpath = 'ex1data2.txt' ...原创 2019-04-27 16:57:00 · 838 阅读 · 0 评论