网络爬虫
小码爱撞墙
这个作者很懒,什么都没留下…
展开
-
Portia---一款开源可视化爬虫工具
https://blog.csdn.net/qq_37275405/article/details/94392157原创 2021-10-27 14:24:18 · 39126 阅读 · 0 评论 -
response.read().decode() UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc6 in position 80: i
错误提示info = response.read().decode()UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc6 in position 80: invalid continuation byte解决方案info = response.read().decode('unicode_escape')原创 2020-12-16 12:55:35 · 49404 阅读 · 3 评论 -
python Selenium控制浏览器自动下拉到底部,实现网页资源全加载
driver = webdriver.Chrome(executable_path='')driver.get(url)driver.execute_async_script("window.scrollTo(0, document.body.scrollHeight)") # 控制浏览器自动滑到底部sleep(2)...原创 2020-12-14 19:29:42 · 50588 阅读 · 7 评论 -
Selenium相关配置
一、安装Selenium库:pip install Selenium二、Selenium-浏览器与驱动对照:驱动下载地址:http://chromedriver.storage.googleapis.com/index.html如下选择驱动:点击Chrome浏览器右上方的,找到【帮助】,找到【关于Google Chrome(G)】,点击之后,会出现这个界面,里面包含了当前Chrome的版本信息。点开驱动的下载地址,对应版本下载就行。下载好【chr...原创 2020-12-09 10:18:44 · 47578 阅读 · 1 评论 -
python Selenium动态网页信息爬取
https://blog.csdn.net/weixin_36279318/article/details/79475388原创 2020-12-09 10:22:22 · 47439 阅读 · 1 评论 -
爬取股票信息
爬取网站网易财经创建的文件List_url.pyfrom finance.code_list import CodeListdef Shanghai_Stock_Index(): """上证指数""" code = int(input("证券代号:")) if code >= 201000 and code <= 900957: year = int(input("年份:")) ...原创 2020-07-04 20:49:48 · 47498 阅读 · 0 评论