python入门中遇到并解决的错误
空空橙
这个作者很懒,什么都没留下…
展开
-
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcd in position 0: invalid continuation byte
昨天在运python3.x行一个之前已经完善好的分词代码时,出现了:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcd in position 0: invalid continuation byte为什么之前使用正常的代码现在报错?上网搜来发现是和被提取文件的编码有关,这才发现自己替换了程序中的目标文件,没留意将编码保存为非UTF-8...转载 2018-03-13 15:25:05 · 3480 阅读 · 0 评论 -
1541415600这样子10位数的日期格式是什么格式?怎么把它变成我们熟悉的YYYY-MM-DD?
这种日期格式叫做时间戳,timestamp。通常由10位或13位数字组成。在python中,time, datetime这两个模块可以帮助我们对其进行转换。示例# 引入模块import time, datetime1 str类型的日期转换为时间戳 1 # 字符类型的时间 2 tss1 = '2013-10-10 23:40:00' 3 # 转为时间数组 4 time...原创 2018-12-11 16:51:13 · 4763 阅读 · 0 评论 -
超好用的json数据查看器!!!
http://www.bejson.com/jsonviewernew/链接如上!!!面的层次复杂的json数据无从下手?试试这个神奇吧!帮你把json格式化,并且用分层视图来显示!真实太好用啦...原创 2018-12-11 16:25:25 · 18480 阅读 · 2 评论 -
怎样理解python面向对象中的__init__方法怎么理解?
https://www.cnblogs.com/liyichen/p/5931840.html我们在学习python类的时候,总会碰见书上的类中有__init__()这样一个函数,很多同学百思不得其解,其实它就是python的构造方法。构造方法类似于类似init()这种初始化方法,来初始化新创建对象的状态,在一个对象呗创建以后会立即调用,比如像实例化一个类:f = FooBar()...转载 2018-12-10 10:33:54 · 392 阅读 · 0 评论 -
python爬虫入门自我答疑:selenium的介绍
selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit,完全由JavaScript编写,因此可以用于任何支持JavaScript的浏览器上。selenium可以模拟真实浏览器,自...原创 2018-11-18 20:35:43 · 169 阅读 · 0 评论 -
python爬虫入门:requests是什么?
Requests is an elegant and simple HTTP library for Python, built for human beings. You are currently looking at the documentation of the development release.通过pip install requests 可以帮你安装它。request可以帮...原创 2018-11-18 19:29:43 · 1410 阅读 · 0 评论 -
win10 安装jupyter notebook
我的电脑已经安装有python2.7和python3.5,在用pip安装jupyter的时候要注意区分是用python27还是python35cmd-python27 -m pip install jupyter notebook等他下载完毕后,在cmd中输入jupyter notebook,如果能够成功在浏览器中自动打开jupyter notebook 页面,那么就安装成功了!页面中显示的文件夹...原创 2018-05-16 17:25:04 · 3883 阅读 · 0 评论 -
Win10系统下,同时安装python2和python3及pip的区别使用
一开始接触python用的是python3,最近需要用到的一些包在3中没有,于是有了使用python2的需求。进入python官网,找到核实的python2 下载安装,和之前安装python3一样,无论是默认安装路径还是自定义安装路径,只要能知道在哪里即可。为了区别怕python2和3两种版本,我将python27中的python.exe和pythonnw.exe文件名后均加上了“27”.将pyt...原创 2018-03-28 11:06:07 · 1111 阅读 · 0 评论 -
append和extend的区别
list.append(object) 向列表中添加一个对象objectlist.extend(sequence) 把一个序列seq的内容添加到列表中12345music_media = ['compact disc', '8-track tape', 'long playing record']new_media = ['DVD Audio disc', 'Super Audio CD']mus...转载 2018-03-25 22:25:36 · 1622 阅读 · 0 评论 -
Matplotlib 绘图并保存
plt.savefig("examples.jpg")原创 2018-03-19 19:47:48 · 1652 阅读 · 0 评论 -
文档-主题分布结果从print输出到csv的代码修改
>>> f=open("D:\MyPythonProject\\testresult.csv","w",encoding="utf-8")>>> label = []>>> for n in range(20): topic_most_pr = doc_topic[n].argmax() label.append(topic原创 2018-03-19 19:35:50 · 319 阅读 · 0 评论 -
去除看不见的换行符
在用python对表格中的评论进行逐行分词后,发现输出的结果行数 与原行数不符,仔细检查了代码发现无论是按行读入,还是按行写入,都没有问题。于是仔细比对原文件和result文件,发现问题在于原文件中存在看不见的换行符。批量去除换行符后,再次运行,分词结果行数无误!yeah方法:假设数据在A列B1输入=TRIM(CLEAN(A1))然后双击单元格右下角黑色十字,则整列单元格中的换行符均被取掉。方法来...原创 2018-03-13 15:30:23 · 1141 阅读 · 0 评论 -
人文社科研究生如何开始进行数据挖掘和文本分析
1.人文社科研究生为什么学习文本分析?人文社科的本质上是研究人的行为和后果。文本分析对我们而言,是一个新型的有力的研究人的行为特点的工具。打破空间和时间的限制,帮助我们去观察那些离我们很远的人,有哪些特点、或者他们的文本传递了哪些信息。情绪、文本相似性、复杂度、主题分类是最常用的分析侧重点。2.完全没有编程基础的外行如何实现文本分析(思路)?2.1 数据的获取方式完...原创 2019-06-27 19:12:37 · 1452 阅读 · 0 评论