自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Frank-Li的博客

IT-笨笨猪,一起happy请加v:Double_dongli

  • 博客(9)
  • 资源 (11)
  • 收藏
  • 关注

原创 Python自然语言处理之jieba分词

1、函数及用法jieba.cut 方法接受三个输入参数:需要分词的字符串cut_all 参数用来控制是否采用全模式HMM 参数用来控制是否使用 HMM 模型jieba.cut_for_search 方法接受两个参数需要分词的字符串是否使用 HMM 模型。jieba.lcut以及jieba.lcut_for_search直接返回 list:利用tf-idf来提取关键词和文本的tags:另外,对于大量...

2018-04-25 16:00:37 541

原创 Python正则表达式(含正则表达式速查表)

1、正则表达式的优点正则表达式能够匹配只要你能描述出来的字符串,对于普通的文本中常用的一些关键词,如果想匹配某种模式很适合用而不是通过普通的contains这种是否含有等匹配。2、python正则表达式速查表3、python正则表达式使用方法:首先,导入python的re模块import re# 将正则表达式编译成Pattern对象pattern = re.compile(r'因.+?入院')#...

2018-04-25 12:13:25 3583

原创 解决seaborn和matplotlib中中文字体显示方框的问题

1、下载字体:2、人工指定字体:import numpy as npimport pylab as plimport matplotlib.font_manager as fmfonts = fm.FontProperties(fname='../fonts/msyh.ttc') # 设置字体t = np.arange(0.0,2.0 * np.pi,0.01) # 自变量取值范围s = np.s...

2018-04-24 18:18:39 5841 1

原创 根据DataFrame某一列的值来选择具体的某一行

原始数据的DF:此时,我要选择列名isInfected为“手足口病”的样本行:总结:选择DataFrame里面某一列等于某个值的所有行,用一条命令即可解决即:df.loc[df['columnName']=='the value']...

2018-04-24 17:55:35 32203 1

原创 使用pandas将DataFrame数据直接写入MySQL数据库

先看下需要存入的df数据:安装并导入需要的库:先创建数据库:开始直接一条pandas入库:入库后查看数据:注意:(1)再进行入库的时候,他会根据列自动选择类型,可能为double、float等,后面如果出现类型不匹配,就会报错,这种情况一定要进入数据库后去改下数据类型,不然会一直报错(2)pymysq:此处用的是pymsql,不要再用mysqldb,这是个坑,很麻烦,安装也很麻烦,还是用这个吧,网...

2018-04-24 17:46:02 62766 9

原创 python遍历目录中文件名称

>>> import os>>> files= os.listdir('E:\\Infectious_data')>>> files['infectious_284215.xml', 'infectious_286167.xml', 'infectious_286168.xml', 'infectious_286891.xml', 'infec...

2018-04-20 15:33:31 1282

原创 Python读取文件编码错误终极解决办法

用python读取文件会出现字符编码问题,有个终结解决办法,就是用二进制去读,就不会出错误了,如下:

2018-04-16 19:41:29 8748 1

原创 使用国内镜像提高python使用pip安装包的速度

国内资源:清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/华中理工大学:http://pypi.hustunique.com/山东理工大学:http://pypi.sdutlinux....

2018-04-02 21:22:51 274

原创 服务器安装jupyter notebook

服务器安装Jupyter notebook,并远程访问使用使用服务器安装jupyter并远程使用的方法较简单,可以按照以下几步进行:1、安装jupyter在带有python环境的服务器上执行命令:pip install jupyter安装过程极其缓慢,中间可能数次会出现链接断开,没办法,重新开始就行了2、生成配置文件(1)在linux下执行命令: jupyter notebook --genera...

2018-04-02 16:35:18 4360 1

page-dewarp-python27,用于python2.7的弯曲文本矫正

ocr识别前的常用预处理函数,用于矫正弯曲文本

2023-07-13

dewarp弯曲文本矫正修正包,用于python3环境

修改后用于python3环境,如果有问题请提出,更新

2023-07-13

doccano个人版本

doccano官网版本的bug太多了,跨域问题、上传文件问题,该版本我都解决了,直接用就好了

2022-11-28

doccano-1.4.1已经打包好的安装镜像

用于doccano的启动

2021-09-01

brat的docker安装镜像文件,方便用于docker安装

用于brat的安装镜像

2021-08-25

brat标注安装包文件

用于brat安装,启动服务,然后NLP进行BIO标注

2021-08-24

slurm集群搭建包.zip

slurm 集群搭建所需的镜像

2021-08-11

2021智源大会报告.pdf

北京智源大会报告文档

2021-07-19

libcudnn.so.8

libcudnn.so.8

2021-07-01

studio-3t-x64.exe

用于连接mongodb

2021-06-30

2021北京智源大会讲义.pdf

大会讲义

2021-06-07

Transmit_5.6.3_xclient.info.dmg

Transmit

2020-04-20

CMU-CS-79-forgy-RETE.pdf

ABSTRACT The Rete Match Algorithm is an efficient method for comparing a large collection of patterns to a large collectionofobjects.Itfindsalltheobjectsthatmatcheachpattern. Thealgorithm wasdevelopedforusein production system interpreters, and it has been used for systems containing from a few hundred to more than a thousand patterns and objects. This article presents the algorithm in detail. It explains the basic concepts of the algorithm, it describes pattern and object representations that are appropriate for the algorithm, and it describes the operations performed by the pattern matcher.

2020-04-20

vsftpd_3.0.3-9build1_amd64.deb

ftp安装包,适用于ubuntu环境,直接使用博客中方式安装即可

2020-04-20

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除