- 博客(4)
- 收藏
- 关注
原创 python读docx报错)
python读docx报错KeyError: "There is no item named 'NULL' in the archive"KeyError: “There is no item named ‘NULL’ in the archive”docx有页脚,要删掉其他错误的可能原因:doc文件会报错,要全文复制到新建的docx里,不能直接改扩展名*脚注读出来可能像xxxx[脚注内容]xxxxxx...
2020-11-09 16:41:30
2780
原创 NLP 相关笔记
吴恩达课程中 部分NLP 相关笔记skip-gram监督学习,把上下文context映射到target上。缺点:慢softmax:负采样选context(上下文)和正确的后续单词,组成第一行,target=1选context和随机词(错误的下文),组成剩下的错误例子,target设置为0context+word作为输入x,target作为y,等待预测除了正确的样本,错误的样本有k个,数据集小,5<k<20,数据集越大,k选的越小,对更大的数据集,2<k<5。
2020-08-07 21:32:52
109
原创 cs231n 相关笔记
KNN根据‘距离’最近的k个已知样本中最多的类别,预测未知样本的类别步骤 准备工作 (准备数据) train—将训练集X和y保存到classifier中 计算distance—计算test(val)中各样本到X_train中各样本的‘距离’ predict—通过在距离最近(distance最小)的k个已知样本中选出出现最多的类型,给出预测 L1、L2距离 L1—曼哈安顿距离,d(x1,x2) = ∑j|x1j-x2j| L2—欧氏距离,d(x1,x2) =√(∑j(x1j-
2020-07-31 16:38:20
221
原创 coursera-NLP最新课程 笔记01
吴恩达自然语言处理(NLP)最新课程 笔记01课程来源-Coursera课程来源-bLogistics regression逻辑回归流程监督学习以情感分析为例,用training set的raw data提取出有用的特征训练classifier并最小化cost根据trained model,进行分类feature extraction分词–提取出所有出现的词句子表示方式:sparse representation–整个词语字典上,句中出现的词标1,其余标0意味着每个句子都
2020-07-30 14:15:36
280
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人