- 博客(9)
- 资源 (11)
- 收藏
- 关注
原创 Python自然语言处理之jieba分词
1、函数及用法jieba.cut 方法接受三个输入参数:需要分词的字符串cut_all 参数用来控制是否采用全模式HMM 参数用来控制是否使用 HMM 模型jieba.cut_for_search 方法接受两个参数需要分词的字符串是否使用 HMM 模型。jieba.lcut以及jieba.lcut_for_search直接返回 list:利用tf-idf来提取关键词和文本的tags:另外,对于大量...
2018-04-25 16:00:37 541
原创 Python正则表达式(含正则表达式速查表)
1、正则表达式的优点正则表达式能够匹配只要你能描述出来的字符串,对于普通的文本中常用的一些关键词,如果想匹配某种模式很适合用而不是通过普通的contains这种是否含有等匹配。2、python正则表达式速查表3、python正则表达式使用方法:首先,导入python的re模块import re# 将正则表达式编译成Pattern对象pattern = re.compile(r'因.+?入院')#...
2018-04-25 12:13:25 3583
原创 解决seaborn和matplotlib中中文字体显示方框的问题
1、下载字体:2、人工指定字体:import numpy as npimport pylab as plimport matplotlib.font_manager as fmfonts = fm.FontProperties(fname='../fonts/msyh.ttc') # 设置字体t = np.arange(0.0,2.0 * np.pi,0.01) # 自变量取值范围s = np.s...
2018-04-24 18:18:39 5841 1
原创 根据DataFrame某一列的值来选择具体的某一行
原始数据的DF:此时,我要选择列名isInfected为“手足口病”的样本行:总结:选择DataFrame里面某一列等于某个值的所有行,用一条命令即可解决即:df.loc[df['columnName']=='the value']...
2018-04-24 17:55:35 32203 1
原创 使用pandas将DataFrame数据直接写入MySQL数据库
先看下需要存入的df数据:安装并导入需要的库:先创建数据库:开始直接一条pandas入库:入库后查看数据:注意:(1)再进行入库的时候,他会根据列自动选择类型,可能为double、float等,后面如果出现类型不匹配,就会报错,这种情况一定要进入数据库后去改下数据类型,不然会一直报错(2)pymysq:此处用的是pymsql,不要再用mysqldb,这是个坑,很麻烦,安装也很麻烦,还是用这个吧,网...
2018-04-24 17:46:02 62766 9
原创 python遍历目录中文件名称
>>> import os>>> files= os.listdir('E:\\Infectious_data')>>> files['infectious_284215.xml', 'infectious_286167.xml', 'infectious_286168.xml', 'infectious_286891.xml', 'infec...
2018-04-20 15:33:31 1282
原创 Python读取文件编码错误终极解决办法
用python读取文件会出现字符编码问题,有个终结解决办法,就是用二进制去读,就不会出错误了,如下:
2018-04-16 19:41:29 8748 1
原创 使用国内镜像提高python使用pip安装包的速度
国内资源:清华:https://pypi.tuna.tsinghua.edu.cn/simple阿里云:http://mirrors.aliyun.com/pypi/simple/中国科技大学 https://pypi.mirrors.ustc.edu.cn/simple/华中理工大学:http://pypi.hustunique.com/山东理工大学:http://pypi.sdutlinux....
2018-04-02 21:22:51 274
原创 服务器安装jupyter notebook
服务器安装Jupyter notebook,并远程访问使用使用服务器安装jupyter并远程使用的方法较简单,可以按照以下几步进行:1、安装jupyter在带有python环境的服务器上执行命令:pip install jupyter安装过程极其缓慢,中间可能数次会出现链接断开,没办法,重新开始就行了2、生成配置文件(1)在linux下执行命令: jupyter notebook --genera...
2018-04-02 16:35:18 4360 1
CMU-CS-79-forgy-RETE.pdf
2020-04-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人