机器学习笔记
CLBTH
这个作者很懒,什么都没留下…
展开
-
机器学习笔记--2.1文本分类
从分类算法层面来看,各类语言的文本分类技术大同小异,但从整个流程来考察,不同语言的文本处理所用到的技术还是有差别的。下面给出中文语言的文本分类技术和流程,主要包括以下几个步骤:(1)预处理:去除文本的噪声信息,例如HTML标签、文本格式转换、检测句子边界等。(2)中文分词:使用中文分词器为文本分词,并去除停用词。(3)构建词向量空间:统计文本词频,生成文本的词向量空间。(4)权重策略——TF-IDF方法:使用TF-IDF发现特征词,并抽取为反映文档主题的特征。(5)分类器:使用算法训练分原创 2022-01-20 16:11:47 · 3700 阅读 · 1 评论 -
机器学习笔记--1.6数据可视化
1.表与线性结构的可视化Python提供四种容器结构--list、dict、set、tuple来装载数据,其中线性结构有两种:list和tuple。由于tuple是只读结构,仅用于外部生成器生成的数据,所以最常用的线性结构就是list。import numpy as npimport matplotlib.pyplot as plt#曲线数据加入噪声x = np.linspace(-5, 5, 200)y = np.sin(x)yn = y +np.random.rand(1, len原创 2022-01-17 16:21:12 · 1034 阅读 · 0 评论 -
机器学习笔记--1.5 数据标准化处理
1.数据标准化标准化后的值 = (标准化前的值 - 分量的均值)/ 分量的标准差vectormat = mat([[1, 2, 3], [4, 5, 6]])v12 = vectormat[0] - vectormat[1]print(sqrt(v12 * v12.T))#标准化varmat = std(vectormat.T, axis = 0)normvmat = (vectormat - mean(vectormat)) / varmat.Tnormv12 = normvmat[原创 2022-01-17 15:35:25 · 625 阅读 · 0 评论 -
机器学习笔记--1.5特征向量和特征值
求特征值和特征向量A = [[8, 1, 6], [3, 5, 7], [4, 9, 2]]evals, evecs = linalg.eig(A)print("特征值:"evals, "\n特征向量:", evecs)输出结果:特征值: [15. 4.89897949 -4.89897949]特征向量: [[-0.57735027 -0.81305253 -0.34164801]...原创 2022-01-17 14:43:05 · 300 阅读 · 0 评论 -
机器学习笔记--1.4特征间的相关性
1.相关系数与相关距离from numpy import *featuremat = mat([[88.5, 96.8, 104.1, 111.3, 117.7, 124.0, 130.0, 135.4, 140.2, 145.3, 151.9, 159.5, 165.9, 169.8, 171.6, 172.3, 172.7], [12.54, 14.65, 16.64, 18.98, 21.26, 24.06, 27.33, 30.46, 33.74, 37.69, 42.49, 48.08,原创 2022-01-16 16:32:34 · 418 阅读 · 0 评论 -
机器学习笔记--1.3数学基础
1.范数L1范数:各个元素绝对值之和;L2范数:各个元素平方和的开方;Lp范数:各个元素绝对值p次方和的1/p次方;L∞范数:各个元素绝对值最大的那个元素。A = (8, 1, 6)#手工计算modA = sqrt(sum(power(A, 2)))print("modA:", modA)#库函数norma = linalg.norm(A)print("norm(A):", normA)2.各类距离的python实现2.1曼哈顿距离from numpy imp原创 2022-01-16 16:00:48 · 212 阅读 · 0 评论 -
机器学习笔记--1.2 Numpy的Linalg库
1.矩阵的行列式from numpy import *#n阶方阵的行列式运算A = mat([[1, 2, 4, 5, 7], [9, 12, 11, 8, 2],[6, 4, 3, 2, 1], [9, 1, 3, 4, 5], [0, 2, 3, 4, 1]])print("det(A):", linalg.det(A))输出结果: det(A): -812.02.矩阵的逆from numpy import *A = cinvA = linalg.inv(...原创 2022-01-15 17:19:27 · 175 阅读 · 0 评论 -
机器学习笔记1.2 SciPy
1.线性代数import numpy as npfrom scipy import linalg#创建矩阵A = np.arrary([[1, 2], [3, 4]])print(A)#求解行列式det = linalg.det(A)print(det)#求逆矩阵A_inverse = linalg.inv(A)print(A_inverse)#特征值和特征向量eigen_values, eigen_vectors = linalg.eig(A)print(eigen原创 2021-12-29 16:07:46 · 777 阅读 · 0 评论 -
机器学习笔记--1.1 Numpy矩阵运算
1.矩阵的初始化import numpy as np#(1)创建一个3*5的全0和全1矩阵myZero = np.zeros([3, 5])myOnes = np.ones([3, 5])#(2)生成随机矩阵myRand = np.random.rand(3, 4)#(3)单位阵myEye = np.eye(3) #3*3的单位阵2.矩阵的元素运算from numpy import *#(1)元素相加和相减myOnes = ones([3, 3])myEye = ey原创 2021-12-29 15:28:14 · 843 阅读 · 0 评论