一只dumpling-CSDN博客

原创 python读docx报错)

python读docx报错KeyError: "There is no item named 'NULL' in the archive"KeyError: “There is no item named ‘NULL’ in the archive”docx有页脚，要删掉其他错误的可能原因：doc文件会报错，要全文复制到新建的docx里，不能直接改扩展名*脚注读出来可能像xxxx[脚注内容]xxxxxx...

2020-11-09 16:41:30 2903

原创 NLP 相关笔记

吴恩达课程中部分NLP 相关笔记skip-gram监督学习，把上下文context映射到target上。缺点：慢softmax:负采样选context(上下文)和正确的后续单词，组成第一行，target=1选context和随机词(错误的下文)，组成剩下的错误例子，target设置为0context+word作为输入x，target作为y，等待预测除了正确的样本，错误的样本有k个，数据集小，5<k<20，数据集越大，k选的越小，对更大的数据集，2<k<5。

2020-08-07 21:32:52 110

原创 cs231n 相关笔记

KNN根据‘距离’最近的k个已知样本中最多的类别，预测未知样本的类别步骤准备工作 (准备数据) train—将训练集X和y保存到classifier中计算distance—计算test(val)中各样本到X_train中各样本的‘距离’ predict—通过在距离最近(distance最小)的k个已知样本中选出出现最多的类型，给出预测 L1、L2距离 L1—曼哈安顿距离，d(x1,x2) = ∑j|x1j-x2j| L2—欧氏距离，d(x1,x2) =√(∑j(x1j-

2020-07-31 16:38:20 221

原创 coursera-NLP最新课程笔记01

吴恩达自然语言处理(NLP)最新课程笔记01课程来源-Coursera课程来源-bLogistics regression逻辑回归流程监督学习以情感分析为例，用training set的raw data提取出有用的特征训练classifier并最小化cost根据trained model，进行分类feature extraction分词–提取出所有出现的词句子表示方式：sparse representation–整个词语字典上，句中出现的词标1，其余标0意味着每个句子都

2020-07-30 14:15:36 282 1

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 python读docx报错)

原创 NLP 相关笔记

原创 cs231n 相关笔记

原创 coursera-NLP最新课程 笔记01

空空如也

空空如也

原创 coursera-NLP最新课程笔记01