- 博客(9)
- 资源 (13)
- 问答 (1)
- 收藏
- 关注
原创 python Automatic-Corpus-Generation sgml文件解析为csv
最近需要用到文本纠错的数据集,但是是sgml格式的,类似xml格式的,我这里顺手用beautifulsoup解析了一下,核心代码还是来自https://github.com/wdimmy/Automatic-Corpus-Generation,但是我修改了一下,分享一下代码:import loggingimport osimport codecsfrom tqdm import tqdmfrom bs4 import BeautifulSoup import pandas as pdde
2020-08-25 11:06:05 683
原创 tensor flow Bad argument number for Name: 3, expecting 4
今天在运行t f1.14的tensorflow程序的时候出现了下面的warning,非常的多,比较烦:WARNING:tensorflow:Entity <bound method Dense.call of <tensorflow.python.layers.core.Dense object at 0x7f36b1322c88>> could not be transformed and will be executed as-is. Please report this
2020-08-24 15:24:04 835
原创 python 实现MinHash和MinHashLSH算法
最近实现了一把MinHash和MinHashLSH算法,发现实现的细节还是挺难的,所以我把datasketch的源代码改了一下,去除了很多冗余的代码,保留了算法的实现主要细节部分。MinHash算法:import hashlibimport numpy as npdef sha1_hash32(data): return struct.unpack('<I', hashlib.sha1(data).digest()[:4])[0]_mersenne_prime = (1 &l
2020-08-23 12:06:47 3459 4
原创 python pandas提取网页的所有表格输出到csv中
今天有人叫我把一个网页的所有的表格都提取出来,其实就是把所有的table标签都解析出来,我这里用pandas神器做了一下,发现出奇的简单:import pandas as pdimport osfrom selenium import webdriverfrom bs4 import BeautifulSoupbrowser = webdriver.Chrome()document_each_year=browser.get(url) html = browser.page_so
2020-08-21 21:31:13 997
原创 python 动手实现朴素贝叶斯
最近尝试不调用scikit-learn来实现一下朴素贝叶斯,发现还是不那么容易上手,我这里分享一下我的实现过程,也欢迎大家来批评指正哈导入库和数据import pandas as pdimport numpy as npfrom sklearn.preprocessing import LabelEncoder,OneHotEncoderfrom collections import defaultdictdata = pd.read_csv("A&E Synthetic Data
2020-08-16 20:51:01 459
原创 python 动手实现tfidf
最近自己实现了一下tfidf,发现实现起来细节跟tfidf的公式还是不大一样,我这里把我的实现过程分享出来。导入一些库和数据import pandas as pdimport globimport numpy as npfrom nltk.tokenize import word_tokenizeimport nltkfrom nltk.corpus import stopwordsimport mathfrom tqdm import tqdm txtfiles=glob.g
2020-08-16 20:27:15 1606 2
原创 Chinese-ELECTRA ‘adam_m not found in checkpoint ‘
今天想利用Chinese-ELECTRA加载预训练权重来进一步训练,结果出现了下面的错误:2020-08-11 22:40:26.262591: W tensorflow/core/framework/op_kernel.cc:1502] OP_REQUIRES failed at save_restore_v2_ops.cc:184 : Not found: Key discriminator_predictions/dense/bias/adam_m not found in checkpoint
2020-08-11 23:30:45 2651 2
原创 neo4j 统计所有的关系总数
今天需要统计一下所有的关系总数:MATCH (n)-[r]->() RETURN COUNT(r)我看百度搜不出来,我这里占了一个坑参考文献[1].COUNTING RELATIONSHIPS IN NEO4J.http://bigdatums.net/2017/01/01/counting-relationships-in-neo4j/...
2020-08-11 11:19:54 5209 2
原创 python flask ModuleNotFoundError: No module named ‘flask_migrate‘
今天在运行github上的开源程序的时候,遇见了下面的错误:(base) ➜ ZhiHuQuestion git:(master) python manage.pyTraceback (most recent call last): File "manage.py", line 2, in <module> from flask_migrate import Migrate, MigrateCommandModuleNotFoundError: No module nam
2020-08-01 11:07:45 5112
openfst-1.6.7.tar.gz
2020-05-06
RotateDemo.rar
2019-05-10
springboot getopenid demo
2019-03-13
pytorch 0.3.1 python3.6 CPU版本whl
2019-03-11
NUS-WIDE多标签分类数据集整理
2018-11-29
VGG_ILSVRC_16_layers_fc_reduced.h5
2018-11-07
Jetson-TX2 tensorflow-1.3.0-cp35-cp35m-linux_aarch64.whl
2017-12-25
bazel-0.6.1-dist.zip 下载
2017-11-15
Connectionist Temporal Classification: A Tutorial with Gritty Details
2017-09-14
TA创建的收藏夹 TA关注的收藏夹
TA关注的人