机器学习
文章平均质量分 58
No Null
这个作者很懒,什么都没留下…
展开
-
自然语言处理之词典分词
目录2. 词典分词2.1 什么是词2.2 词典2.3 切分算法2.4 字典树2.5 基于字典树的其它算法2.6 HanLP的词典分词实现2. 词典分词中文分词:指的是将一段文本拆分为一系列单词的过程,这些单词顺序拼接后等于原文本。中文分词算法大致分为基于词典规则与基于机器学习这两大派。2.1 什么是词在基于词典的中文分词中,词的定义要现实得多:词典中的字符串就是词。词的性质–齐夫定律:一个单词的词频与它的词频排名成反比。2.2 词典互联网词库(SogouW,原创 2021-08-28 10:20:20 · 2196 阅读 · 0 评论 -
pytorch基本语法
Pytorch基本语法Pytorch 是一个基于NUMPY的科学计算包,提供强大的GPU强大功能的能力1. 创建矩阵的操作1.1 创建一个没有初始化的矩阵x = torch.empty(5, 3)x# 输出结果"""tensor([[9.2755e-39, 1.0561e-38, 4.5919e-39], [5.1429e-39, 4.9592e-39, 8.9082e-39], [8.9082e-39, 1.0194e-38, 9.1837e-39],原创 2021-08-26 16:09:11 · 256 阅读 · 0 评论 -
Python机器学习之简单线性回归以及案例分析
简单线性回归本次介绍最简单的线性回归模型——将数据模拟合成一条直线。直线模拟的模型方程为 y = ax + b,其中 a 是直线斜率,b 是直线截距。模拟数据从斜率为2,截距是-5的直线中抽取散点并绘制散点图代码如下:# 常用库import matplotlib.pyplot as pltimport seaborn as sns;sns.set()import numpy as np#这里的randomstate=1指的是伪随机数生成器的种子,简单来说每个种子对应一个随机数rng =原创 2021-05-13 18:02:47 · 607 阅读 · 7 评论