python
文章平均质量分 50
小猴子跳跳
这个作者很懒,什么都没留下…
展开
-
python 文本挖掘 实战中遇到的问题
一、python日志文件运行程序在自动爬取数据,已经进行了好长时间,突然发现程序自动关闭了,也没有出现任何异常错误。但是问题就来了,那么程序结束时爬取到哪里了呢?这时候就十分需要日志文件,来记录程序执行过程。感谢下列文章,作者指出‘培养码代码的好习惯,设置日志,打印程序运行中的细节,以便调试代码’。(文本挖掘从小白到精通(二)---语料库和词向量空间,来源Scottish Fold CatsSocial Listening与文本挖掘2019-05-08)代码如下,注意,要生成log文件..原创 2021-02-26 23:26:53 · 381 阅读 · 1 评论 -
安装bertopic库入的坑们
今天掉进坑里好多次,得记录下来,以便别人和自己再次犯类似的错误。最近发现了python的bertopic这个库,通过学习了解到它很适合短文本的处理,我正好要处理评论性的文本,所以想着好好学习下。看了库的说明也觉得很简单,短短几行代码就能解决问题,然而,事实并不如此,可能和我这个python小白有关,本来python基础就不好,所以遇到了很多意想不到的问题。一、安装bertopic时总是提示Could not build wheels for hdbscan which use PEP 517 and c原创 2021-02-25 22:55:45 · 3914 阅读 · 2 评论 -
【小甲鱼零基础入门学python】学习总结之集合
一、集合的创建class set([iterable])class frozenset([iterable]) :注:通过frozenset()建立的集合是不可变的。返回一个新的 set 或 frozenset 对象,其元素来自于 iterable。 集合的元素必须为 hashable。 要表示由集合对象构成的集合,所有的内层集合必须为 frozenset 对象。 如果未指定 iterabl...原创 2020-04-15 15:37:17 · 263 阅读 · 1 评论 -
【小甲鱼零基础入门学python】学习总结之字典
一、字典的创建和修改>>> p=dict(((1,'one'),(2,'two'),(3,'Three'))) #用p=dict((()))创建>>> p{1: 'one', 2: 'two', 3: 'Three'}>>> t=dict(([1,'一'],[2,'二'],[3,'三']))#用p=dict(([]))创建>&g...原创 2020-04-14 17:40:54 · 2593 阅读 · 0 评论 -
【小甲鱼零基础入门学python】学习总结之lambda、filter及map函数
一、lambda:简化书写,不用起名字>>> g=lambda x,y:2*x+y>>> g(5,6)16>>> p={'大学':13,'设计':9,'美国':16}>>> t=list(p)>>> t['大学', '设计', '美国']>>> t=list(p.item...原创 2020-04-13 19:14:47 · 158 阅读 · 0 评论 -
【小甲鱼零基础入门学python】学习总结之函数参数
函数的参数会涉及以下几个概念:形式参数(parameter)、实际参数(argument)、默认参数、关键字参数、可变参数(收集参数)一、形参与实参>>> def test(name,content): #name 和content是形式参数(定义时候的参数) print(name+'-->'+content)>>> test('小猴子跳跳','...原创 2020-04-13 12:38:21 · 148 阅读 · 0 评论 -
【小甲鱼零基础入门学python】学习总结之函数文档
>>> def MyfirstDef(): ('这是一个自定义的函数\n' '用来说明函数文档\n' '函数文档需要写在函数语句前面\n' #需要注意的地方 '函数文档可以用MyfirstDef.__doc__来调用,要注意doc前后是双下划线\n' #需要注意的地方 '函数文档也可以用help(MyfirstDef)来调用,而且这种形式显示的格式更清...原创 2020-04-10 19:42:12 · 113 阅读 · 0 评论 -
Python 列表的'='赋值拷贝、浅拷贝与深拷贝
a=[1,2,3,['boy','girl']]b=a.copy()c=aprint('列表a的ID:',id(a))print('列表b的ID:',id(b))print('列表a:',a)print('用copy复制a的列表b:',b)print('用c=a复制a的列表c:',c)print('\n')a.append('a')print('给列表a最后加入字符“a”即a...原创 2020-04-03 14:26:44 · 397 阅读 · 0 评论 -
【小甲鱼零基础入门学python】学习笔记之了不起的分支和循环
1.Python 条件表达式条件成立时执行的语句 if condition else 条件不成立时执行的语句如下:输出两个数字中小的那个数字n=eval(input())m=eval(input())print(n if n<m else m)2.语句太多需要分行书写(1. 用小括号2. 用换行符)n=eval(input())m=eval(input())s=(n+...原创 2020-04-01 16:36:07 · 161 阅读 · 0 评论 -
python 运算符 优先级
总结一下就是:算数运算: 乘方 > 乘除 >加减>大于比较运算: 同级:==、!=、>、>=、<、<=大于逻辑运算: not>and >or转自:http://c.biancheng.net/view/2190.html...原创 2020-03-31 17:55:05 · 180 阅读 · 0 评论 -
【小甲鱼零基础入门学python】学习笔记之数值类型
一、数值类型python 有四种数字类型:int(整数)、bool(布尔类型)、float(浮点数)以及complex(复数)1.浮点数浮点数需要注意以下两点:(1)尾数不确定:当你输入0.3==0.1+0.2时会 结果是False,因为由于二进制的关系>>>0.1+0.2>>>0.30000000000000004(2)针对浮点数的尾数不确定...原创 2020-03-31 17:33:01 · 247 阅读 · 0 评论 -
【python】文件读写学习心得
今早着重重新学习了一下python的文件读写,有几个新的学习收获需要记录:(主要内容学习自嵩天教授的《Python语言程序设计课程》,以及《[小甲鱼]零基础入门学习Python》)一、文件的读假设f为文件,有三种读文件的方式f.read(n)这是按照字符读,读取文件的前n个字符。若n缺省,则f.read()是读取全部内容。需要注意的是,它返回的是一个字符串形式。它读取完后,文件指针会指到...原创 2020-03-30 13:12:46 · 1737 阅读 · 0 评论 -
python 第三方库 文件安装方法(北理工嵩天老师Python语言程序设计课程 笔记)
python 第三方库 文件安装方法(北理工嵩天老师Python语言程序设计课程 笔记)如果你发现你要按照的第三方库,利用pip install 指令可以下载,但不具备编译环境无法安装它,你就需要在https://www.lfd.uci.edu/~gohlke/pythonlibs/ 中找到该第三方库及相应版本进行安装,安装时,需要注意要下载与你的计算机安装的python版本相对应的第三方库的版...原创 2020-03-25 16:18:12 · 398 阅读 · 0 评论 -
嵩天老师的mooc《Python语言程序设计》 第六周 字典练习:人名最多数统计
北京理工大学 嵩天老师的mooc《Python语言程序设计》 第六周 字典练习:人名最多数统计描述:编程模板中给出了一个字符串,其中包含了含有重复的人名,请直接输出出现最多的人名。``s = ‘’‘双儿 洪七公 赵敏 赵敏 逍遥子 鳌拜 殷天正 金轮法王 乔峰 杨过 洪七公 郭靖杨逍 鳌拜 殷天正 段誉 杨逍 慕容复 阿紫 慕容复 郭芙 乔峰 令狐冲 郭芙金轮法王 小龙女 杨过 慕容复...原创 2020-03-25 12:35:43 · 4924 阅读 · 1 评论 -
python return a or b
python return a or b一:0、’’、[]、()、{}、None 在布尔上下文中为假;其它任何东西都为真。二:and 的返回结果问题:从左到右计算表达式,返回碰到的第一个假值,如果都为真没有假值,则返回最后一个真值。三:or 的返回结果问题:从左到右计算表达式,返回碰到的第一个真值,如果都是假的值,则返回最后一个假的值。参考作者:莫辜负自己的一世韶光链接:https:...原创 2020-03-23 23:17:20 · 2228 阅读 · 1 评论