自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Learning from the mistakes

我问佛∶世间为何有那麽多遗憾? 佛曰∶这是一个婆娑世界,婆娑既遗憾, 没有遗憾,给你再多幸福也不会体会快乐。

  • 博客(9)
  • 资源 (13)
  • 问答 (1)
  • 收藏
  • 关注

原创 python Automatic-Corpus-Generation sgml文件解析为csv

最近需要用到文本纠错的数据集,但是是sgml格式的,类似xml格式的,我这里顺手用beautifulsoup解析了一下,核心代码还是来自https://github.com/wdimmy/Automatic-Corpus-Generation,但是我修改了一下,分享一下代码:import loggingimport osimport codecsfrom tqdm import tqdmfrom bs4 import BeautifulSoup import pandas as pdde

2020-08-25 11:06:05 683

原创 tensor flow Bad argument number for Name: 3, expecting 4

今天在运行t f1.14的tensorflow程序的时候出现了下面的warning,非常的多,比较烦:WARNING:tensorflow:Entity <bound method Dense.call of <tensorflow.python.layers.core.Dense object at 0x7f36b1322c88>> could not be transformed and will be executed as-is. Please report this

2020-08-24 15:24:04 835

原创 python 实现MinHash和MinHashLSH算法

最近实现了一把MinHash和MinHashLSH算法,发现实现的细节还是挺难的,所以我把datasketch的源代码改了一下,去除了很多冗余的代码,保留了算法的实现主要细节部分。MinHash算法:import hashlibimport numpy as npdef sha1_hash32(data): return struct.unpack('<I', hashlib.sha1(data).digest()[:4])[0]_mersenne_prime = (1 &l

2020-08-23 12:06:47 3459 4

原创 python pandas提取网页的所有表格输出到csv中

今天有人叫我把一个网页的所有的表格都提取出来,其实就是把所有的table标签都解析出来,我这里用pandas神器做了一下,发现出奇的简单:import pandas as pdimport osfrom selenium import webdriverfrom bs4 import BeautifulSoupbrowser = webdriver.Chrome()document_each_year=browser.get(url) html = browser.page_so

2020-08-21 21:31:13 997

原创 python 动手实现朴素贝叶斯

最近尝试不调用scikit-learn来实现一下朴素贝叶斯,发现还是不那么容易上手,我这里分享一下我的实现过程,也欢迎大家来批评指正哈导入库和数据import pandas as pdimport numpy as npfrom sklearn.preprocessing import LabelEncoder,OneHotEncoderfrom collections import defaultdictdata = pd.read_csv("A&E Synthetic Data

2020-08-16 20:51:01 459

原创 python 动手实现tfidf

最近自己实现了一下tfidf,发现实现起来细节跟tfidf的公式还是不大一样,我这里把我的实现过程分享出来。导入一些库和数据import pandas as pdimport globimport numpy as npfrom nltk.tokenize import word_tokenizeimport nltkfrom nltk.corpus import stopwordsimport mathfrom tqdm import tqdm txtfiles=glob.g

2020-08-16 20:27:15 1606 2

原创 Chinese-ELECTRA ‘adam_m not found in checkpoint ‘

今天想利用Chinese-ELECTRA加载预训练权重来进一步训练,结果出现了下面的错误:2020-08-11 22:40:26.262591: W tensorflow/core/framework/op_kernel.cc:1502] OP_REQUIRES failed at save_restore_v2_ops.cc:184 : Not found: Key discriminator_predictions/dense/bias/adam_m not found in checkpoint

2020-08-11 23:30:45 2651 2

原创 neo4j 统计所有的关系总数

今天需要统计一下所有的关系总数:MATCH (n)-[r]->() RETURN COUNT(r)我看百度搜不出来,我这里占了一个坑参考文献[1].COUNTING RELATIONSHIPS IN NEO4J.http://bigdatums.net/2017/01/01/counting-relationships-in-neo4j/...

2020-08-11 11:19:54 5209 2

原创 python flask ModuleNotFoundError: No module named ‘flask_migrate‘

今天在运行github上的开源程序的时候,遇见了下面的错误:(base) ➜ ZhiHuQuestion git:(master) python manage.pyTraceback (most recent call last): File "manage.py", line 2, in <module> from flask_migrate import Migrate, MigrateCommandModuleNotFoundError: No module nam

2020-08-01 11:07:45 5112

StegoShare.jar.zip

一个小工具,可以隐藏文件到某文件中,也可以从某文件中提取该文件

2021-05-24

openfst-1.6.7.tar.gz

编译ctcdecode所需要的第三方库,下载地址为:https://sites.google.com/site/openfst/home/openfst-down/openfst-1.6.7.tar.gz

2020-05-06

RotateDemo.rar

QT5版本的旋转图片的动画,编译器用的mingW,代码进行了重构改良,文章请参考: https://blog.csdn.net/w5688414/article/details/90072287

2019-05-10

springboot getopenid demo

springboot实现用户信息授权获取用户的id, 写的教程地址为https://blog.csdn.net/w5688414/article/details/88541743

2019-03-13

pytorch 0.3.1 python3.6 CPU版本whl

pytorch 0.3.1 python3.6 CPU版本whl,这个属于老版本了,在官网上都不容易找到,我这里分享出来

2019-03-11

NUS-WIDE多标签分类数据集整理

博客地址为:https://blog.csdn.net/w5688414/article/details/84593705 用keras进行多标签分类的图片数据集,图片取自于NUS-WIDE数据集

2018-11-29

VGG_ILSVRC_16_layers_fc_reduced.h5

VGG_ILSVRC_16_layers_fc_reduced.h5文件,用于ssd keras模型,考虑到国内没有搜到该资源,我来当当搬运工

2018-11-07

Jetson-TX2 tensorflow-1.3.0-cp35-cp35m-linux_aarch64.whl

最近编译成功了tensorflow 1.3的版本,tensorflow-1.3.0-cp35-cp35m-linux_aarch64.whl,把编译成功的文件分享给大家

2017-12-25

bazel-0.6.1-dist.zip 下载

官网地址为:https://github.com/bazelbuild/bazel/releases/,但是很难下载下来,我用的是校园网,都下了好久,我把我下载的包分享给大家,希望对大家有用

2017-11-15

Connectionist Temporal Classification: A Tutorial with Gritty Details

教程:Connectionist Temporal Classification详解补充中文翻译的对应的英文原版教程,链接为:http://blog.csdn.net/w5688414/article/details/77867786,希望能帮助到大家

2017-09-14

操作系统页面置换LRU,FIFO,OPT算法实现代码

LRU算法,FIFO算法,OPT算法,belady现象

2015-01-05

异步框架上传客户端示例

android异步框架应用的一个小小的示例

2014-09-16

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除