自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(17)
  • 收藏
  • 关注

原创 "开始"菜单中应用图标不显示,怎么解决?

我的chorme浏览器不知为何,在开始菜单变成了这个亚子虽说毫不影响使用,但是强迫症如我还是想让它好好的显示出来。解决方案:右击该图标——从开始屏幕取消固定 使用小娜搜索“chrome”——右击打开文件位置 重新将chrome.exe固定到开始屏幕,形成新的快捷方式后,它的图标就可以正常显示啦 ...

2019-07-05 10:36:48 8569 4

原创 人文社科研究生如何开始进行数据挖掘和文本分析

1.人文社科研究生为什么学习文本分析?人文社科的本质上是研究人的行为和后果。文本分析对我们而言,是一个新型的有力的研究人的行为特点的工具。打破空间和时间的限制,帮助我们去观察那些离我们很远的人,有哪些特点、或者他们的文本传递了哪些信息。情绪、文本相似性、复杂度、主题分类是最常用的分析侧重点。2.完全没有编程基础的外行如何实现文本分析(思路)?2.1 数据的获取方式完...

2019-06-27 19:12:37 1495

原创 1541415600这样子10位数的日期格式是什么格式?怎么把它变成我们熟悉的YYYY-MM-DD?

这种日期格式叫做时间戳,timestamp。通常由10位或13位数字组成。在python中,time, datetime这两个模块可以帮助我们对其进行转换。示例# 引入模块import time, datetime1 str类型的日期转换为时间戳 1 # 字符类型的时间 2 tss1 = '2013-10-10 23:40:00' 3 # 转为时间数组 4 time...

2018-12-11 16:51:13 4811

原创 超好用的json数据查看器!!!

http://www.bejson.com/jsonviewernew/链接如上!!!面的层次复杂的json数据无从下手?试试这个神奇吧!帮你把json格式化,并且用分层视图来显示!真实太好用啦...

2018-12-11 16:25:25 18558 2

转载 怎样理解python面向对象中的__init__方法怎么理解?

https://www.cnblogs.com/liyichen/p/5931840.html我们在学习python类的时候,总会碰见书上的类中有__init__()这样一个函数,很多同学百思不得其解,其实它就是python的构造方法。构造方法类似于类似init()这种初始化方法,来初始化新创建对象的状态,在一个对象呗创建以后会立即调用,比如像实例化一个类:f = FooBar()...

2018-12-10 10:33:54 403

原创 python爬虫入门自我答疑:selenium的介绍

selenium 是一套完整的web应用程序测试系统,包含了测试的录制(selenium IDE),编写及运行(Selenium Remote Control)和测试的并行处理(Selenium Grid)。Selenium的核心Selenium Core基于JsUnit,完全由JavaScript编写,因此可以用于任何支持JavaScript的浏览器上。selenium可以模拟真实浏览器,自...

2018-11-18 20:35:43 180

原创 python爬虫入门:requests是什么?

Requests is an elegant and simple HTTP library for Python, built for human beings. You are currently looking at the documentation of the development release.通过pip install requests 可以帮你安装它。request可以帮...

2018-11-18 19:29:43 1420

原创 stata做计量入门常用代码一览!

在经管论文实证中,常常要分行业分年度、分省份分年度等分组回归,保存出回归出来的某些参数。常用的 命令参考如下:一、statsby的命令格式及说明statsby命令格式为:statsby [exp_list] [, options ]: command其具体内容,请参见STATA的help文件,即:help statsby在分组回归中,statsby最重要的是如下三个部分:...

2018-08-12 23:52:15 11054

原创 用VBA去除表格中的数字

Sub RemoveNum()'Updateby20131129Dim Rng As RangeDim WorkRng As RangeOn Error Resume NextxTitleId = "KutoolsforExcel"Set WorkRng = Application.SelectionSet WorkRng = Application.InputBox("Range", xTitl...

2018-05-27 12:21:52 1642

原创 利用VBA拆分包含多行数据的excel表格

首先,打开数据文件中,按住alt依次按f11,i,m. 即打开VBA的模块粘贴下面代码后按f5运行,会在该目录下得到拆分后的文件.Sub test()Application.ScreenUpdating = Falsep = ThisWorkbook.Path & "\"With ActiveSheetFor r = 1 To .Range("a1048576").End(xlUp).Ro...

2018-05-27 12:11:26 3688 1

原创 win10 安装jupyter notebook

我的电脑已经安装有python2.7和python3.5,在用pip安装jupyter的时候要注意区分是用python27还是python35cmd-python27 -m pip install jupyter notebook等他下载完毕后,在cmd中输入jupyter notebook,如果能够成功在浏览器中自动打开jupyter notebook 页面,那么就安装成功了!页面中显示的文件夹...

2018-05-16 17:25:04 3895

原创 Win10系统下,同时安装python2和python3及pip的区别使用

一开始接触python用的是python3,最近需要用到的一些包在3中没有,于是有了使用python2的需求。进入python官网,找到核实的python2 下载安装,和之前安装python3一样,无论是默认安装路径还是自定义安装路径,只要能知道在哪里即可。为了区别怕python2和3两种版本,我将python27中的python.exe和pythonnw.exe文件名后均加上了“27”.将pyt...

2018-03-28 11:06:07 1142

转载 append和extend的区别

list.append(object) 向列表中添加一个对象objectlist.extend(sequence) 把一个序列seq的内容添加到列表中12345music_media = ['compact disc', '8-track tape', 'long playing record']new_media = ['DVD Audio disc', 'Super Audio CD']mus...

2018-03-25 22:25:36 1642

原创 Matplotlib 绘图并保存

plt.savefig("examples.jpg")  

2018-03-19 19:47:48 1663

原创 文档-主题分布结果从print输出到csv的代码修改

>>> f=open("D:\MyPythonProject\\testresult.csv","w",encoding="utf-8")>>> label = []>>> for n in range(20): topic_most_pr = doc_topic[n].argmax() label.append(topic

2018-03-19 19:35:50 333

原创 去除看不见的换行符

在用python对表格中的评论进行逐行分词后,发现输出的结果行数 与原行数不符,仔细检查了代码发现无论是按行读入,还是按行写入,都没有问题。于是仔细比对原文件和result文件,发现问题在于原文件中存在看不见的换行符。批量去除换行符后,再次运行,分词结果行数无误!yeah方法:假设数据在A列B1输入=TRIM(CLEAN(A1))然后双击单元格右下角黑色十字,则整列单元格中的换行符均被取掉。方法来...

2018-03-13 15:30:23 1172

转载 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcd in position 0: invalid continuation byte

昨天在运python3.x行一个之前已经完善好的分词代码时,出现了:UnicodeDecodeError: 'utf-8' codec can't decode byte 0xcd in position 0: invalid continuation byte为什么之前使用正常的代码现在报错?上网搜来发现是和被提取文件的编码有关,这才发现自己替换了程序中的目标文件,没留意将编码保存为非UTF-8...

2018-03-13 15:25:05 3866

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除