自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_45144934的博客

原创 Linux安装glibc

目录1.直接安装(出现错误请看2）2.错误CENTOS7错误:Cannot find a valid baseurl for repo: base/7/x86_6wget无法解析主机域名glibc是GNU发布的libc库，即c运行库。glibc是linux系统中最底层的api，几乎其它任何运行库都会依赖于glibc，刚安装Linux后，使用中可能会用到glibc库，安装库时遇到的问题整理了一下：1.直接安装(出现错误请看2）使用命令su，输入密码后进入root模式：su使用命令sudo yum安

2021-03-25 22:43:26 7060 1

原创为什么平方损失函数不适应于分类问题？——从概率论的角度

为什么平方损失函数不适用于分类问题？邱锡鹏教授《神经网络与深度学习》的课后习题特别经典，并且书中并没有解答，非常值得我们思考，今天的这个问题就是出自此书的第二章的习题，想来和大家分享一下本题的一种思路，是从数据分布的角度叙述，本人知识有限不免有错误，希望大家能给予批评和建议，提出您的看法。首先给出平方损失函数（Quadratic-Entropy Loss Function）的数学定义：L(y,f(x;θ))=12(y−f(x;θ))2L(y,f(x; θ)) = \frac{1}{2}(y-f(x;θ

2021-03-25 21:55:28 2931

原创基于文本分类的机器学习-数据处理、One-hot、TF-IDF、Bag of word

数据处理-THUCNews在此部分需要完成的功能为：读取数据、提取文本类别、数据预处理（分词、one-hot、数据集划分）、提取 tfidf 特征参数、迭代器（将数据分批传入模型）使用到的工具：scikit-learn、jieba、numpy处理架构：data_process.py 为数据的预处理文件read_data（）:读取数据save_categories（）:提取分类目录，转换成{类别1|类别2…}表示，写入本地；pre_data（）:数据预处理，去停词、分词、编码（先将中文数字

2021-03-24 20:36:53 637

原创 TF-IDF算法详解与应用

TF-IDFTF-IDF是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。这里直接调用的 sklearn 中的TfidfVectorizer 。def get_tfidf(self,X_train,X_test): vectorizer = TfidfVectorizer(min_df = 100) vectorizer.fit_transform(X_train) X_train_vec = vectorizer.transform(X_train) X_te

2021-03-24 20:34:04 4156

原创自然语言处理中N-gram

一、N-gram介绍在这篇文章中，我们将要介绍N-grams，这是自然语言处理中的一个概念，其含义是按照字节进行大小为N的滑动窗口操作，形成N个字节片段的序列。本质上是一种基于统计语言模型的算法对于形成的每一个字节片段（gram）进行频度统计，并且按照事先设定好的阈值进行过滤，形成关键gram列表，也就是这个文本的向量特征空间，列表中的每一种gram就是一个特征向量维度。下面用几个在电影评价中的例子来说明N-gram的简单应用：(1) . 漂亮（2-gram）(2) . 纪录片（3-gram）

2021-03-23 12:30:12 10514 2

原创基于文本分类的机器学习-LR类处理多分类问题

基础知识部分：Logistic 回归是一种常用的处理二分类问题的线性模型。Softmax回归是logistic 回归问题再多分类上的推广，对于多分类问题，类别标签lable ： y可以有C个取值，给定一个样本x，softmax回归预测判断属于类别c的条件概率为：其中，w 是第c类的权重向量在tensorflow框架下表示为： ##在Tensorflow图中为训练数据输入x和输出y创建占位符 self.x = placeholder(tf.float32, [None, self.s

2021-03-22 08:19:50 638

原创 Tensorflow 学习笔记（一）逻辑回归、 tensor、tf.Variable、tf.placeholder、sess 占位符、张量

Tensorflow 学习笔记（一）逻辑回归、 tensor、tf.Variable、tf.placeholder、sess占位符、张量第一部分：定义第二部分：执行（会话）占位符、张量)Tensorflow 将程序分成两个独立的部分——计算图的定义、计算图的执行（提高并行能力）。第一部分：定义为了构建计算图，需要定义所有要执行的常量、变量和运算操作。计算图是包含节点和边的网络，张量tensor对象是tensorflow中使用的数据，包括常量 tf.constant、变量tf.Variable和占

2021-03-21 21:36:05 226

“同心协力”策略研究.pdf

本文针对理想状态、现实状态两种情况对“同心协力”游戏进行了研究，通过受力分析建立了多目标优化模型，给出在各种情形下团队的最佳协作策略。本文为本小组三人三日三夜完成，获得省一等奖，希望能给大家提供一些帮助。

2019-10-16

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

张弓天道 CSDN认证博客专家 CSDN认证企业博客

码龄5年

IP 属地：浙江省

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

7: 原创

105万+: 周排名

33万+: 总排名

2万+: 访问

: 等级

199: 积分

18: 粉丝

55: 获赞

3: 评论

88: 收藏

私信

关注

热门文章

最新评论

自然语言处理中N-gram
努力小子: 确实，应该是写错了，不过理解了问题不大，博主写的蛮好的，简洁易懂
自然语言处理中N-gram
qq_41449752: "拿二元模型来说，我们会根据前一个词语进行预测，那么我们可以说它的概率为（前一个词语“wi-1”在单词“wi”之前出现的次数）/（前一个单词“wi-1”在语料库中出现的总次数） ="，那你后面的公式为什么写成Count(Wi)而不是Count(Wi-1)?
Linux安装glibc
Deep Learning小舟: 走心好文，必须收藏！

最新文章

提示

确定要删除当前文章？

取消删除