![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python学习
看我七十三变
这个作者很懒,什么都没留下…
展开
-
python3.4.4中安装py2neo模块
为了用python连接上neo4j数据库,我们需要导入一个外部的模块py2neo,此模块python本身是没有的。1.打开dos,直接pip3 install py2neo 这样安装的就是最新的模块了,目前是4.0了,安装其他模块numpy等等也是这样。 当然,你要想安装自己要的那个版本的模块,可以在后面加上版本号, 如:pip3 install py2neo 3.1.2 pip3是p...原创 2018-07-29 21:56:02 · 3875 阅读 · 0 评论 -
(九)jieba分词后,无法去除停用词的解决方法
问题原因:编码问题1、测试codeimport chardetif __name__ == '__main__': f = file2file() s = '中国是个好地方,我住在这里。' stopwords = set(sum(f.readtxt('../data/HITstopwords.txt'), [])) # 查看s字符集 s_charse...原创 2019-04-25 21:54:43 · 4140 阅读 · 0 评论 -
(八)文件类型or变量类型的转换code(持续更新)
.csv数据转为.jsonimport pandas as pddata = pd.read_csv('file1.csv')# 以列号为字典,构建json数据data.to_json('file2.json',orient='index',force_ascii=False)原创 2019-03-17 19:36:43 · 302 阅读 · 0 评论 -
(七)一个实例(抽行,抽列,构建字典,统计分析数据)
直接上code,供我以后参考,两个小部分code1: commons.py# 打开文件,默认为"读文件"def open_file(filename, mode='r'): return open(filename, mode, encoding='utf-8', errors='ignore')# 读入数据,默认分割符为','def read_file(filename, ...原创 2018-12-12 11:17:58 · 393 阅读 · 0 评论 -
(六)文本文件预处理
下面是有关处理文本文件的小结1、强烈推荐把open函数写出自定义的函数,一般用来读文件,在写文件时调用时,会体现这样写的方便性。def open_file(filename, mode='r'): return open(filename, mode, encoding='utf-8', errors='ignore')2、具体读文件中的操作:这是一个很自定义的函数,处理不同的文件...原创 2018-12-12 10:36:10 · 802 阅读 · 0 评论 -
(五)对百度地图Web API中requests返回对象的处理
1、requests.get(url)的返回对象调试ing.png一行代码temp = requests.get(url).text可以很容易的“get”到url中的如“content”、“text”等等东西2、关于获得的str类型数据的处理1.直接把返回的json对象转为dict来进一步访问: # req_dict = requests.get(url).json()...原创 2018-11-12 19:59:54 · 485 阅读 · 0 评论 -
windows8.1(64位)下Pycharm的安装
Pycharm是一款python编程编辑器。和python安装完自带的IDLE基础功能一样,但是却十分强大。在Pycharm中,你可以有非常多的选择,如选择python解释器版本,在线下载多种python模块(包)等等。IDLE与Pycharm的功能区别就像记事本与word功能区别一样。1、下载地址:https://www.jetbrains.com/pycharm/download/#sec...原创 2018-07-29 21:52:08 · 1293 阅读 · 0 评论 -
windows8.1(64位)JDK的安装
1、下载地址:http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html 我推荐安装这个版本2、点击下载,下载完成后,双击安装文件,在安装过程中注意,安装的东西会放在两个文件夹里,分别是jdk…,jre…两次都建议更改路径,但是请把这两个文件夹放在一个根目录下。 这两处路...原创 2018-07-29 21:53:26 · 1312 阅读 · 0 评论 -
PyCharm Community Edition 2018.2 x64版本下,导入或添加各类python包
1、新建工程时,选择设置好当前工程的python解释器路径为自己安装的python的路径,Pyacharm就会自动扫描到当前解释器下的所有可用的模块,以列表形式显示在解释器下方(包括当前版本和最新版本)。 File->Settings->Project:工程名字->Project Interpreter。 2、点击“齿轮按钮(工具)”->Add-&原创 2018-07-30 09:55:08 · 9483 阅读 · 0 评论 -
(四)百度地图开发平台介绍&调用Web API
待做原创 2018-11-12 17:17:11 · 712 阅读 · 0 评论 -
(二)依据词频,构造词汇表(单个字符级)
步骤:1.打开文件test1.txt2.读取文件3.筛选test1中高频词(含标点,空格),构成词汇表代码import sysfrom collections import Counterimport numpy as ndef open_file(filename, mode='r'): return open(filename, mode, encoding='ut...原创 2018-10-24 19:48:26 · 884 阅读 · 0 评论 -
(三)计算TF-IDF的值
1、假设(1)共有m篇文档(2)第i篇文档,包含Ki个词(3)第i篇文档,词j出现的次数,记为Ci,j(4)含有词j的文档一共有Lj篇2、数据解释TF:Term frequency(词频):某个词在该文档中出现的频率IDF:Inverse document frequency(逆文档频率):总文档数m与含有词i的文档数的比值的对数3、计算:以第i篇文档中的词j为例TF = Ci...原创 2018-10-29 20:19:12 · 849 阅读 · 0 评论 -
(一)打开、读取文件
(1)**读取文件**小记1.strip()和split()函数要依据文本实际情况,灵活使用2.打开模式mode参数要注意一下3. 编码标准也要注意4.with语句的使用注意一下5.list的常用方法6.注意打开、读取文件中可能出现的异常与处理def open_file(filename): return open(filename, mode='r', encoding='utf-8'...原创 2018-10-21 16:49:42 · 310 阅读 · 0 评论 -
windows8.1(64位)下,Python安装
Python安装过程: 1. 下载地址:https://www.python.org/downloads/windows/ 2. 建议安装3.4.4版本,3.3版本安装完成后,目录下没有Scripts文件夹。而3.4.4安装完成后,目录下已经有Scripts文件夹,打开Scripts文件夹,我们会Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaT...原创 2018-07-29 19:40:54 · 5866 阅读 · 0 评论 -
(十)文本embedding的相关操作
1. glove转为word2vec两句代码,from gensim.scripts.glove2word2vec import glove2word2vecglove2word2vec('glove.840B.300d.txt', 'test.txt')# 参数(glove文件路径,目标位置)2. torchtext生成embeddingimport torchimport nu...原创 2019-05-05 10:31:04 · 1729 阅读 · 2 评论