- 博客(8)
- 收藏
- 关注
原创 python中import, process(), __name__的联系
最近总是碰到同学仔问python多进程学习中,如果在if __name__ == "__main__":外创建进程为什么会报错。特意整理了一下相关知识点,记录如下。 import 导入模块 先是import的相关知识。 import导入模块会将整个模块里的内容放进内存中(放进内存相当于运行一遍)。定义的类和函数放在内存中没用调用因此不会执行,但执行函数的语句会执行一遍。 # tets1.py d...
2019-04-23 22:29:03 886
原创 python中的序列化——从pickle模块到json模块的扩展
encode() 和 decode() 的局限性 在python基础函数中,对数据的保存需要将字符串转化为字节流才能保存到文件中。 encode()将字符串转化为字节流,decode()将字节流转化为字符串,但都只局限于对字符串进行转化。 res_b = '我爱你'.encode('utf-8') print(res_b, type(res_b)) res = res_b.decode('utf...
2019-04-01 21:52:20 290
原创 CSV(逗号分隔值文件)简单使用方法
今天学了什么学了什么?让我想想…CSV!逗号分隔值文件(好神(dou)奇(bi)的名字)!好进入主题,作为记录数据的文件,一定有其和其他数据记录文件不能比的过人之处。比如: 1. 能用excel直接打开! 就是这么神奇!先贴上csv文件~嘻嘻嘻~意淫一下我女神 然后噔噔蹬蹬~天!女神不见了!!!其实是我加密了哈哈哈(开玩笑)~~~真正原因是不支持中文天啊,或者解码后可以,还没尝试过。就当...
2018-08-23 20:36:54 8839 2
原创 python高级语法——(1)GIL学习
GIL(全局解析器锁) GIL,全局解析器锁,只对多线程有影响。 如果没有GIL,多线程会同时调用全局资源,造成全局资源结果发生混乱错误。 因此每个线程在执行过程中都需要先获取GIL,保证同一时刻只有一个线程在执行代码,不会造成全局资源混乱。 例子 下面代码保存为sinle_thread.py,同时运行两个single_thread.py,两个程序各占满两个CPU核心,...
2018-08-19 21:59:20 312
原创 爬贴吧——(1)先爬一下贴吧的帖子列表
import requests from lxml import etree class TiebaSpider(object): def __init__(self, tieba_name): # 初始化需要用到的变量 self.tieba_name = tieba_name self.url = "http://tieba.baidu.com/mo/q...
2018-08-17 16:58:11 495
原创 lxml模块学习
etree模块 etree.HTML() 将字符串类型转换为Element类型 传入字符串参数,返回element类型 from lxml import etree text = ''' <div> <ul> <li class="item-1"><a&
2018-08-06 22:30:45 1113
原创 XPath Helper使用教程
XPath浏览器常用插件:XPath Helper XPath Helper是一个浏览器插件,能在element中定位元素。 下载地址 百度网盘下载 密码:yuuv 下载完成后选择保留 安装 在导航栏中输入chrome://extensions; 将.crx文件拖拽到扩展程序页面中,勾选已启用按钮。 使用 重启浏览器,快捷键CTRL+SHIFT+X开启XPath ...
2018-08-04 02:07:36 39398 7
原创 用XPath提取捧腹网笑话文本
记录基本语法,使用一些简单的XPath语法提取文本 基本语法 获取文本/text() /@ 获取属性/@属性名 筛选属性//标签[@属性名] // 在xpath开始的时候表示从当前html中任意位置开始选择 a//b表示a标签下的任意b标签 ...
2018-08-04 01:00:44 438
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人