- 博客(8)
- 资源 (5)
- 收藏
- 关注
原创 ubuntu解决”Failed to connect to raw.githubusercontent.com“报错
4.保存退出后,就可以正常使用了。
2024-07-16 16:48:45
174
转载 2021-11-01
寻找两个dataframe中相同关键列中元素的差集问题有以下两个数据集,df1、df2,其中df1的VendorName和df2的VendorName的特征是相同的,现在要找出特征在df1中但是不在df2中的集合。#找到交集df_transactions_IN = df_transactions[df_transactions["VendorName"].isin(df_approved["VendorName"])]#找df_1 - df_2 差集df_unapproved = df_t
2021-11-01 11:19:24
120
转载 熵(entropy)、交叉熵(cross-entropy)
原文:一文搞懂熵(Entropy),交叉熵(Cross-Entropy)一、熵1、混乱程度,不确定性,信息量?不同的人对熵有不同的解释:混乱程度,不确定性,惊奇程度,不可预测性,信息量等等,面对如此多的解释,第一次接触时难免困惑。本文第一部分,让我们先一起搞明白 熵 究竟是什么?信息论中熵的概念首次被香农提出,目的是寻找一种高效/无损地编码信息的方法:以编码后数据的平均长度来衡量高效性,平均长度越小越高效;同时还需满足“无损”的条件,即编码后不能有原始信息的丢失。这样,香农提出了熵的定义:无损编码事
2021-05-21 11:55:42
1555
原创 关于standford core nlp运行时报错RuntimeError: Java not found.
关于standford core nlp运行时报错RuntimeError: Java not found.有两种可能:java jdk版本问题删除C:\Windows\System32 下的java.exe、javaw.exe和javaws.exe详情参考:java版本问题导致standfordcorenlp报错standfordcorenlp占用资源问题为了循环处理大数据集,我写了个循环。 while True: try: nlp = Stan
2021-03-03 09:42:09
1330
1
原创 在windows10下,pycharm运行指针生成网络的数据预处理make_datafiles.py时,遇到的坑
指针生成网络python3源码链接:https://github.com/becxer/pointer-generator/数据预处理/python3源码链接:https://github.com/becxer/cnn-dailymail/原文是在linux系统下运行的,在windows下略有不同:一、启动脚本Linux下启动sh文件传入两个story路径,具体方法参考上面链接。windows下,在pycharm中,点击右上角make_datafiles小三角,点击edit configura
2021-01-01 22:31:58
313
1
转载 记录复现指针生成网络时数据预处理中遇到的问题
原论文中数据预处理部分链接:https://github.com/becxer/cnn-dailymail/运行python make_datafiles.py /path/to/cnn/stories /path/to/dailymail/stories,报“找不到或无法加载主类 edu.stanford.nlp.process.PTBTokenizer”错误。再尝试运行echo “Please tokenize this text.” | java edu.stanford.nlp.process.P
2020-12-30 23:20:41
433
Sentiment Analysis by Capsules.pdf
2020-04-06
Bag of Tricks for Efficient Text Classification.pdf
2020-04-06
Character-levelConvolutionalNetworksforText Classification
2020-04-06
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人