自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 资源 (1)
  • 收藏
  • 关注

原创 VSCode SSH远程连接,扩展失效,可能是因为中文插件

原因不太清楚,可能和中文编码有关,以前的服务器ssh连接后插件也是正常使用,可能是目前这台机器比较老旧吧。有同样问题的朋友可以试一下删除本地中文插件,在网上查了很多也没有发现类似的解决方案,发一篇博客供大家参考。ssh连接远程主机,shell正常,文件查看正常,但是所有插件安装后都失效。

2024-04-03 16:14:48 568 4

原创 RNN:循环神经网络

文章目录语言模型计算规则n-gram循环神经网络实例实现语言模型NLP中需要处理的最常见的数据就是文本数据,语言模型就是将一段自然语言文本看作一段离散的时间序列,假如有一段长度为TTT的文本分词后为:w1,w2,...wTw_1,w_2,...w_Tw1​,w2​,...wT​,那么就看作是在TTT时间步内(time step)产生了TTT个词,每步产生一个,而语言模型的就是去计算以该序列产生这TTT个词的概率:P(w1,w2,....wT)P(w_1,w_2,....w_T)P(w1​,w2​,

2020-08-11 02:23:01 199

原创 分词工具:jieba

文章目录分词工具:jieba+nlkjieba算法特点安装功能介绍与实例载入词典词性查询基于TF-IDF算法的关键词抽取使用基于 TextRank 算法的关键词抽取参考文献分词工具:jieba+nlkjieba“结巴”python中文分词组件,对python2/3均兼容,安装方便可使用pip直接安装。主要功能为分词、添加自定义词典、关键词提取、词性标注等算法基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图(DAG)采用动态规划查找最大概率路径,找出基于词频的最大

2020-07-14 01:09:52 651

原创 HMM模型

HMM:隐马尔可夫模型最大熵模型熵在信息论中学过,表现的是系统所处状态的不确定性程度。表示的是这个信息系统的平均信息量也即平均不确定程度。最大熵模型(the maximum entropy principle)是指保留全部的不确定性将风险降低到最小。例如根据拼音wang-xiao-bo可以转换为王小波(作者)和王晓波(研究两岸关系的学者),但是具体转换为谁应当根据上下文确定。因此我们建立一个最大熵模型,使得同时满足这两种信息。香农奖得主数学家希萨(Csiszar)证明了对于任何一组不自相矛盾的信息,这

2020-07-13 22:12:29 2949

原创 机器学习笔记:支持向量机学习(4)

第四章:支持向量机学习 + 神经网络学习MOOC笔记1. 最大边缘超平面· 线性分类器基本想法是:在样本空间中寻找一个超平面将不同的样本数据分开,图中B1就是划分矩形样本点和圆形样本点的一个超平面· 但是这样的超平面可能不止一个,分类器需要做的是选取最优的超平面来表示决策边界。衡量的标准就是:超平面的边缘。**这是因为具有较大边缘的决策边界比那些具有较小边缘的决策边界具有更好的泛化误...

2020-04-07 14:00:26 1692

原创 机器学习笔记:线性回归(3)

2020-04-07 13:58:24 60

原创 机器学习笔记:绪论+模型评估(1、2)

2020-04-07 13:52:59 132

5.机器学习—神经网络.md

机器学习笔记(5):神经网络,学习资源为:机器学习-周志华 + MOOC 中国地质大学机器学习课程

2020-04-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除