![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python
灵虚天
这个作者很懒,什么都没留下…
展开
-
csv文件操作和爬虫抓取豆瓣影评并生成词云图
1. csv文件操作csv文件windows默认是excel打开的,是一种表格式文件import csv #导入csv的库# 一次写入多行文本时,会多换一行,可以设置newline=""来解决with open("喜喜.csv", "w",newline="",encoding="utf-8") as file: # writer: 获取csv的写编辑对象 csvWriter = csv.writer(file) info = [ # 定义一个二维列表作为表格内容原创 2020-09-17 20:39:58 · 4822 阅读 · 1 评论 -
爬虫
定义爬虫:使用python程序模拟浏览器向服务器发送请求,接受服务器响应爬虫与反爬虫:想要获取大量数据,需要频繁的向服务器发请求,当服务器检测到短时间请求次数过多,会评定为恶意请求,直接封禁IP。为了解决封禁IP的问题,使用IP代理池,可以频繁更换IP,但IP代理池并不稳定,而且需要付费爬虫时应尽量规避特大型网站,以一二线网络公司为主爬虫库安装:python的爬虫、数据分析、机器学习都需要安装对应的库pip 是安装爬虫库的工具,,python安装库的管道爬虫的请求库reques..原创 2020-09-17 19:51:41 · 289 阅读 · 0 评论 -
正则表达式
定义正则表达式:用来检索、替换符合某个模式的文本元字符和普通字符(原子操作:什么字符表示什么含义)```python[abc] :匹配a或b或c abc :匹配abc[a-z] :匹配所有小写字母[a-zA-Z] :匹配所有字母[0-9]或\d :匹配所有数字 \D :匹配非数字字符[a-zA-Z0-9]:匹配所有字母和数字 . :匹配 \n \r以外任意字符^[abc] :匹配以a或b或c开头的字符.原创 2020-09-15 19:26:30 · 76 阅读 · 0 评论 -
Python下载和基础知识
创建应该新的项目:输入文件名:路径一定不能有中文名,JDK安装路径一定不能和安装包放一起1. 数据类型知识点在python中不需要声明变量,直接定义赋值即可。由python环境自动编译识别变量的类型。可以使用type获取变量的类型python每行末尾不需要分号python 3 以后小小数只有float,无double型bool类型的True和False首字母必须大写python的单行注释符号是#python的多行注释符号是""“内容”"";使用三引号print函数:控制台原创 2020-09-15 19:19:04 · 129 阅读 · 0 评论