NLP
文章平均质量分 92
李坦(BNU远程教育学)
北京师范大学互联网教育博士生
展开
-
梯度下降与ReLU激活函数
14.梯度下降与ReLU激活函数14.1 梯度下降法在数学中,梯度表示函数递增速度最快的方向,反之梯度的负方向则表示函数衰减最快的方向。因此,可以通过不断迭代使用梯度下降方法求解到函数的最小值。(可能是局部最小值,也可能是全局最小值),这取决于学习率的选择。如:为了求解函数f(x)=f(x1,x2…xn)f(x)=f(x_1,x_2\dots x_n)f(x)=f(x1,x2…xn)的最小值,则可以从一个起始点:x(0)=(x1(0),x2(0),…xn(0))x^{(0)}=(x_1^{(0)}原创 2020-09-24 16:27:59 · 3162 阅读 · 1 评论 -
机器学习打印日志
在机器学习过程中,为了可以实时反映处理过程,经常打印日志,实现对该过程的实时监控。import logginglogging.basicConfig(format = '%(asctime)s : %(levelname)s : %(message)s', level = logging.INFO) #打印日志作为一名非科班出身的教育技术学研究生,技术水平十分有限。近期看到教育工作者在处理数据是比较困难,包括本教育技术学的科研工作者在面对大批量数据时也是束手无策,于是萌生了为教育工作者写一.原创 2020-06-02 21:08:06 · 366 阅读 · 0 评论 -
12万条微博训练的word2vec词向量模型
该语言模型是采用gensim库提供的word2vec模型训练而成,训练样本量达12万条博文,该模型能够反映一定的语言规律,因此可以作为日常编程训练使用。1.调用方法from gensim.models import word2vecmodel = word2vec.Word2Vec.load("public_opinion_word2vec_2.model")2.测试model.most_similar("上海")3.项目开源地址https://github.com/GarrettL.原创 2020-05-18 09:45:20 · 1665 阅读 · 9 评论 -
python实现文本词频统计并输出
教育研究中,经常对一个或者多个文本进行词频统计分析,用以反映该文本的主题。本文首先介绍利用oset开源库中提供的wordcount()函数实现的字符统计简单调用方式(第2小节);随后解析wordcount()函数源代码以及其中的一些知识点(第3小节)。1.文件夹内容展示该文件夹中分别包含“教育学部.txt”,“心理学部.txt”等单个文件。我们将利用oset库中wordcount函数实现...原创 2020-05-03 13:05:14 · 5928 阅读 · 2 评论 -
全集!将GitHub上的项目克隆到本地并完成更新与上传教程全集
GitHub是一个面向开源及私有软件项目的托管平台,因为只支持git 作为唯一的版本库格式进行托管,故名GitHub。GitHub于2008年4月10日正式上线,除了Git代码仓库托管及基本的 Web管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。托管版本数量也是非常之多,其中不乏知名开源项目 Ruby on Rails、jQuer...原创 2020-03-30 13:07:15 · 1613 阅读 · 0 评论 -
NLPIR分词库出现:Your license appears to have expired. Try running "pynlpir update".问题解决办法
出现Your license appears to have expired. Try running "pynlpir update"的原因是:您的nlpir没有获取最新授权,解决办法如下:STEP1:进入张华平博士的github并点击下载NLPIR.user的文件请点击跳转,进入NLPIR.user的下载页面随后点击:downloadSTEP2:将下载的文件放置在Pynlpir的...原创 2020-03-24 16:42:05 · 2594 阅读 · 1 评论