自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(18)
  • 收藏
  • 关注

原创 python 文本挖掘 实战中遇到的问题

一、python日志文件运行程序在自动爬取数据,已经进行了好长时间,突然发现程序自动关闭了,也没有出现任何异常错误。但是问题就来了,那么程序结束时爬取到哪里了呢?这时候就十分需要日志文件,来记录程序执行过程。感谢下列文章,作者指出‘培养码代码的好习惯,设置日志,打印程序运行中的细节,以便调试代码’。(文本挖掘从小白到精通(二)---语料库和词向量空间,来源Scottish Fold CatsSocial Listening与文本挖掘2019-05-08)代码如下,注意,要生成log文件..

2021-02-26 23:26:53 356 1

原创 安装bertopic库入的坑们

今天掉进坑里好多次,得记录下来,以便别人和自己再次犯类似的错误。最近发现了python的bertopic这个库,通过学习了解到它很适合短文本的处理,我正好要处理评论性的文本,所以想着好好学习下。看了库的说明也觉得很简单,短短几行代码就能解决问题,然而,事实并不如此,可能和我这个python小白有关,本来python基础就不好,所以遇到了很多意想不到的问题。一、安装bertopic时总是提示Could not build wheels for hdbscan which use PEP 517 and c

2021-02-25 22:55:45 3796 2

原创 【小甲鱼零基础入门学python】学习总结之集合

一、集合的创建class set([iterable])class frozenset([iterable]) :注:通过frozenset()建立的集合是不可变的。返回一个新的 set 或 frozenset 对象,其元素来自于 iterable。 集合的元素必须为 hashable。 要表示由集合对象构成的集合,所有的内层集合必须为 frozenset 对象。 如果未指定 iterabl...

2020-04-15 15:37:17 223 1

原创 【小甲鱼零基础入门学python】学习总结之字典

一、字典的创建和修改>>> p=dict(((1,'one'),(2,'two'),(3,'Three'))) #用p=dict((()))创建>>> p{1: 'one', 2: 'two', 3: 'Three'}>>> t=dict(([1,'一'],[2,'二'],[3,'三']))#用p=dict(([]))创建>&g...

2020-04-14 17:40:54 2563

原创 【小甲鱼零基础入门学python】学习总结之lambda、filter及map函数

一、lambda:简化书写,不用起名字>>> g=lambda x,y:2*x+y>>> g(5,6)16>>> p={'大学':13,'设计':9,'美国':16}>>> t=list(p)>>> t['大学', '设计', '美国']>>> t=list(p.item...

2020-04-13 19:14:47 150

原创 【小甲鱼零基础入门学python】学习总结之函数参数

函数的参数会涉及以下几个概念:形式参数(parameter)、实际参数(argument)、默认参数、关键字参数、可变参数(收集参数)一、形参与实参>>> def test(name,content): #name 和content是形式参数(定义时候的参数) print(name+'-->'+content)>>> test('小猴子跳跳','...

2020-04-13 12:38:21 121

原创 【小甲鱼零基础入门学python】学习总结之函数文档

>>> def MyfirstDef(): ('这是一个自定义的函数\n' '用来说明函数文档\n' '函数文档需要写在函数语句前面\n' #需要注意的地方 '函数文档可以用MyfirstDef.__doc__来调用,要注意doc前后是双下划线\n' #需要注意的地方 '函数文档也可以用help(MyfirstDef)来调用,而且这种形式显示的格式更清...

2020-04-10 19:42:12 107

原创 Python 列表的'='赋值拷贝、浅拷贝与深拷贝

a=[1,2,3,['boy','girl']]b=a.copy()c=aprint('列表a的ID:',id(a))print('列表b的ID:',id(b))print('列表a:',a)print('用copy复制a的列表b:',b)print('用c=a复制a的列表c:',c)print('\n')a.append('a')print('给列表a最后加入字符“a”即a...

2020-04-03 14:26:44 385

原创 【小甲鱼零基础入门学python】学习笔记之了不起的分支和循环

1.Python 条件表达式条件成立时执行的语句 if condition else 条件不成立时执行的语句如下:输出两个数字中小的那个数字n=eval(input())m=eval(input())print(n if n<m else m)2.语句太多需要分行书写(1. 用小括号2. 用换行符)n=eval(input())m=eval(input())s=(n+...

2020-04-01 16:36:07 155

原创 python 运算符 优先级

总结一下就是:算数运算: 乘方 > 乘除 >加减>大于比较运算: 同级:==、!=、>、>=、<、<=大于逻辑运算: not>and >or转自:http://c.biancheng.net/view/2190.html...

2020-03-31 17:55:05 176

原创 【小甲鱼零基础入门学python】学习笔记之数值类型

一、数值类型python 有四种数字类型:int(整数)、bool(布尔类型)、float(浮点数)以及complex(复数)1.浮点数浮点数需要注意以下两点:(1)尾数不确定:当你输入0.3==0.1+0.2时会 结果是False,因为由于二进制的关系>>>0.1+0.2>>>0.30000000000000004(2)针对浮点数的尾数不确定...

2020-03-31 17:33:01 222

原创 【小甲鱼零基础入门学python】 笔记1

变量值互换x,y=y,xAlt+p 可以复制上一行代码原始字符串中的转义字符不再有效(原始字符串即在字符串前面加个字母r) print(r"D:\rds\ds\tfd")结果为:D:\rds\ds\tfd3<=4 注意:<与=得肩并肩 中间不能有空格。统一一起缩紧n行代码:将n 行代码选中后 Ctrl+[,或者Ctrl+]强制停止正在运行的pyt...

2020-03-30 18:53:30 449

原创 【python】文件读写学习心得

今早着重重新学习了一下python的文件读写,有几个新的学习收获需要记录:(主要内容学习自嵩天教授的《Python语言程序设计课程》,以及《[小甲鱼]零基础入门学习Python》)一、文件的读假设f为文件,有三种读文件的方式f.read(n)这是按照字符读,读取文件的前n个字符。若n缺省,则f.read()是读取全部内容。需要注意的是,它返回的是一个字符串形式。它读取完后,文件指针会指到...

2020-03-30 13:12:46 1701

原创 python 第三方库 文件安装方法(北理工嵩天老师Python语言程序设计课程 笔记)

python 第三方库 文件安装方法(北理工嵩天老师Python语言程序设计课程 笔记)如果你发现你要按照的第三方库,利用pip install 指令可以下载,但不具备编译环境无法安装它,你就需要在https://www.lfd.uci.edu/~gohlke/pythonlibs/ 中找到该第三方库及相应版本进行安装,安装时,需要注意要下载与你的计算机安装的python版本相对应的第三方库的版...

2020-03-25 16:18:12 390

原创 嵩天老师的mooc《Python语言程序设计》 第六周 字典练习:人名最多数统计

北京理工大学 嵩天老师的mooc《Python语言程序设计》 第六周 字典练习:人名最多数统计描述:编程模板中给出了一个字符串,其中包含了含有重复的人名,请直接输出出现最多的人名。``s = ‘’‘双儿 洪七公 赵敏 赵敏 逍遥子 鳌拜 殷天正 金轮法王 乔峰 杨过 洪七公 郭靖杨逍 鳌拜 殷天正 段誉 杨逍 慕容复 阿紫 慕容复 郭芙 乔峰 令狐冲 郭芙金轮法王 小龙女 杨过 慕容复...

2020-03-25 12:35:43 4915 1

原创 python return a or b

python return a or b一:0、’’、[]、()、{}、None 在布尔上下文中为假;其它任何东西都为真。二:and 的返回结果问题:从左到右计算表达式,返回碰到的第一个假值,如果都为真没有假值,则返回最后一个真值。三:or 的返回结果问题:从左到右计算表达式,返回碰到的第一个真值,如果都是假的值,则返回最后一个假的值。参考作者:莫辜负自己的一世韶光链接:https:...

2020-03-23 23:17:20 2178 1

原创 如何利用citespace分析cnki里的文献——(1)导入数据

这里写自定义目录标题新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入##(一)在cnki中导出数据按照自己的...

2019-11-05 14:36:43 39168 13

原创 运行citespace出现闪退,无法打开现象如何处理

运行citespace出现闪退,无法打开现象如何处理一、配置java环境找到我的电脑——属性——高级系统设置——高级——环境变量——环境变量页面下方的“系统变量“”点击“新建”(1)(2)(3) 单击“path”系统变量,点击“编辑”,单击“新建”,输入“%JAVA_HOME%\bin”通过搜索找到并删除java.exe,javaw.exe,javas.exe这三个文件...

2019-11-01 15:22:12 21062 2

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除