Python
落花人独立_微雨燕双飞
这个作者很懒,什么都没留下…
展开
-
pip下载numpy,pyqt5, opencv等python包
由于这些包都在国外,所以下载起来不方便。这里借助清华大学的镜像来提高下载速度。进入cmd,输入pip install numpy ** -i https://pypi.tuna.tsinghua.edu.cn/simple**...原创 2020-03-11 19:11:11 · 286 阅读 · 0 评论 -
python写爬虫的弯路
一开始按照视频上的找了笔趣阁的网站先爬一部小说, 找了<遮天>,但是章节太多,爬起来太慢, 就换了一个几十章的小说. 根据视频里的去写了代码, 在正则表达式哪里出了很大的问题. from bs4 import BeautifulSoupimport requestsimport re先找到了小说主页的链接地址: url = 'https://www.biquge5.c...原创 2019-01-24 15:24:20 · 1375 阅读 · 0 评论 -
关于 'list' object has no attribute 'select'
我是在写爬虫是遇到了这个问题: c = chapter.select('href')AttributeError: 'list' object has no attribute 'select'这是我的代码:chapter = soup.select('ul._chapter > li > a')c = chapter.select('href')原因: selec...原创 2019-01-24 15:32:16 · 19640 阅读 · 0 评论 -
替换html里面的\r\n及解决记事本中的每个段落只有一行的情形
1. 在用python爬取小说的时候, 发现在内容里每次换行都有\r\n(即回车, 换行)出现.此时可以采用 s.replace('\\r\\n','') , 其中s为字符串类型.2. 在爬取完小说内容后, 用记事本打开时每个段落无论长短都只占一行,此时可以点击记事本上方的 '格式' --> '自动换行' 解决....原创 2019-02-05 16:45:23 · 1155 阅读 · 0 评论 -
用python爬取小说章节内容
在学爬虫之前, 最好有一些html基础, 才能更好的分析网页. 主要是五步:1. 获取链接2. 正则匹配3. 获取内容4. 处理内容5. 写入文件代码如下:#导入相关modelfrom bs4 import BeautifulSoupimport requestsimport re#获取目标链接地址url = 'http://www.biquyun....原创 2019-02-05 16:44:22 · 2954 阅读 · 0 评论 -
使用Vscode写python
在python官网下载好python2.x 或者 3.x, 然后在vscode 下载python插件. 写一个python程序, 运行, vscode会自动提示你配置python执行路径,并帮你创建好.vscode文件夹. 除了task需要配置外,其他的vscode都会自动帮你配好. 下面讲一下怎么配置task使得可以用contrl+shift+B就运行程序.(也可以使用shift+e...原创 2019-02-05 16:45:03 · 1794 阅读 · 0 评论