自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (3)
  • 收藏
  • 关注

原创 任选一个英文文本,如何统计其中单词出现的个数

思路:首先要读取英文文本.txt,然后对读取文本进行“空格化”,方便单个单词的识别,最后将数据写入新文本中。代码如下import collectionswith open('test.txt','r',encoding='UTF-8') as f: String=f.read().split(' ')text = collections.Counter(String)with open('result.txt','w') as r: for key,value in text.i

2020-06-29 21:19:56 1316

原创 发送短信验证码时触发天级流控Premit:10

今天在用手机注册账号的时候遇到的。问题的结果就是发不出验证码,会提示触发天级流控premit:10错误。原因在此简单说一下:申请验证码的手机号已经多次并且超出运营商业务限流程度,所以你再申请,就不给你发了。解决办法目前我的解决办法就是换其他手机号注册,就可以了。如果是解决限流的手机号问题,目前我还没找到具体有效方法,如果您有建议,可在下方留言同大家分享。tips:如果是私人手机号出现...

2020-04-13 09:42:34 27955 1

原创 python3版本安装aiohttp库

在安装aiohttp库中遇到的一些问题并已经解决(本人用的是python 3.8版本)首先用pip3命令安装pip3 install aiohttp但是运行后,出现问题运行超时了,python安装库的同通病:网速不稳定问题。但是我没有去用镜像网安装,而是再次试一次,继续pip3 命令这次终于下好了aiohttp.whl文件,但是又自动下了另一个库——yarl,结果又因为网络问题中...

2020-04-04 15:10:13 4205 2

原创 python爬虫代理出现计算机积极拒绝问题解决

学习爬虫代理中,出现了如下问题from urllib.error import URLErrorfrom urllib.request import ProxyHandler,build_openerproxy = '127.0.0.1:9743'proxy_handler = ProxyHandler({ 'http':'http://' + proxy...

2020-04-03 18:13:00 54455

原创 selenium爬取淘宝商品

对于《python3网络爬虫实战分析》中selenium爬取淘宝商品信息代码进行修改。原代码from selenium import webdriverfrom selenium.common.exceptions import TimeoutExceptionfrom selenium.webdriver.common.by import Byfrom selenium.webdriv...

2020-03-27 19:27:40 1243 1

原创 Python3在连接Splash端口时遇到目标计算机积极拒绝问题

问题检索={requests.exceptions.ConnectionError: HTTPConnectionPool(host=‘localhost’, port=8050): Max retries exceeded with url: /render.html?url=https://www.baidu.com (Caused by NewConnectionError(’<url...

2020-03-27 11:44:03 703 1

原创 安装Docker(Docker Toolbox)与Splash库

想要安装Splash库,先安装Docker。1.Docker安装但是面对windows运行环境,大部分的情况来看,需要先安装Docker Toolbox才可以。我是win10系统,安装了Docker for Windows,但是不能用。首先可以官网下载Docker Toolboxhttps://docs.docker.com/toolbox/toolbox_install_windows...

2020-03-26 18:48:33 780

原创 python3爬虫给seleium库所遇到的问题

学习《python3网络爬虫实战分析》的第七章selenuim库中出现的问题。错误检索={1.Warning (from warnings module):browser = webdriver.Chrome(chrome_options=options)DeprecationWarning: use options instead of chrome_optionsTraceback ...

2020-03-24 16:37:46 9591 4

原创 安装MySQL库引发的惨案

问题检索={1.pymysql.err.OperationalError: (2003, “Can’t connect to MySQL server on ‘localhost’ ([WinError 10061] 由于目标计算机积极拒绝,无法连接。)”)2.pymysql.err.OperationalError: (1045, “Access denied for user ‘root’...

2020-03-20 23:55:35 250

原创 《python3网络爬虫实战分析》第三章重难点总结+猫眼电影爬虫代码

此处seq可以省略不用,因为会报错:TypeError: ‘seq’ is an invalid keyword argument for print()cookies.txt文件保存在你正在编程python文件运行的文件夹中在维持知乎登陆方法介绍中,从网页中复制的headers内容,其中Cookie、Host和user-agent 后不能出现空格,不然报错。但是爬取的页面,却无法...

2020-03-18 09:58:13 1209

原创 目前最稳妥最安全的解决win10自动更新问题的方法

我在网上看了不少关于解决win10自动更新的办法,但都是有缺点的。比如,禁止两天后有自动更新、开机后蓝屏、电脑偶尔死机等等。这些关闭更新的技术或多或少都有些后遗症,并不可靠。我思来想去,难道就没有更安全的解决办法?我们遇到的问题是,win10开机自动更新,会影响我们的正常的工作和学习进程。在紧急的情况下,等它更新好了,黄花菜都凉了。所以,既然阻止不了win10更新,那就转变问题,如何不让w...

2020-03-15 12:22:57 1047

原创 通过requests库re库进行淘宝商品爬虫爬取(对中国大学mooc嵩天老师爬虫进行修改)

中国大学mooc上的爬取淘宝页面商品已经因为淘宝的维护而无法爬取比如,只出现个表头:这是我按照嵩天老师代码学习,遇到的问题。原代码如下:import requestsimport redef getHTMLText(url): try: r= requests.get(url,timeout=30) r.raise_for_status(...

2020-03-09 21:38:48 3945 34

原创 python爬虫学习第一天笔记

1.我所看的教程,所用的是python3之前版本,所以涉及到的urllib库命令都已经更换了,所以要学会看python源文档是一个必须要做的工作。部分命令如下,方便以后查询:python2之urllib命令 Python3之urllib命令urllib.urlretrieve() urllib.request.urlretrieve()urllib.urlcleanup() ...

2020-02-29 20:39:26 314

原创 USDA食品数据库示例中资源缺失和解决办法

第七章中示例:USDA食品数据库所给的关于原始数据(食品数据库的JSON版)的资源链接,经过搜索,已经失效了(第二版)。后经努力寻找,终于找到一个资源,现分享给大家,免去学习数据分析中去寻找资料而劳苦伤神。上传了CSDN,还在审核中,不知道能不能成功。放在GitHub中,可能网速下载较为慢,已经压缩成rar格式。https://github.com/Theo-yu/python-for-d...

2020-02-12 17:43:38 503

原创 AttributeError: module 'pymongo' has no attribute 'Connection'

学习ipython数据分析(利用python进行数据分析第二版)中,存取MongoDB中的数据,书中程序如下:但是在运行第二行代码的时候,出现了问题:意思是说pymongo不能用connection这一功能。从前一篇文章遇到的错误中可以推断出,这也许是因为版本更新的问题导致个别函数名称有所更改。因此只好查阅pymongo的操作手册:查看后得知,函数名已经更改。所以,正确更正如下:原来...

2020-01-14 10:29:24 1143

原创 DataFrame内pickle序列化的存储(save)和读取(load)问题

关于pickle序列化存储问题,书上程序如下:但是在运行的时候出现如下错误:意思是说,DataFrame里面没有‘save’这一功能属性,也就是不能用。后来查阅后操作手册后发现,原来个别函数的属性功能会随着版本更新而变化。显然,此书中相应的命令更改为:存储 frame.save →frame.to_pickle读取 frame.load → frame.read_pickle...

2020-01-13 10:46:36 2917

原创 NameError:name 'sys' is not defined

在学习python数据分析的数据加载、存储与文件格式,170页,想实现如下程序效果:但是却出现错误:图片内的sys.stout应该改成sys.stdout错误意思是说‘sys’没有定义过。关键是翻阅此书籍,愣是没找到提前定义‘sys’的代码。所以,为了防止出现错误,应该事先定义,如下:再次出入代码运行:成功。...

2020-01-13 10:41:40 18321

原创 《python数据分析》第六章pd.read_csv()函数读取文本时候出现的错误

在建立好csv文档之后,运用pd进行读取,并通过read_csv()函数进行标题设定。但是按照书本上进行,却遇到了这种情况:一是多读取文本信息存在转义符——\t;二是标题a、b、c、d和message都跑到了后面,造成行列输错NaN。其问题在于ex1.csv文档兼容问题。如果出现这中问题的时候去打开该文档,会出现如下情况:原本数据理应单格存放的,但是现在却全部缩在一个格子里。这是由于c...

2020-01-13 10:39:22 1485

原创 《Python数据分析》中的Unix!cat 命令与Windows!type命令的转变问题

在《Python数据分析》的第六章关于读取文本格式介绍部分,涉及到使用cmd命令。但因为作者原使用的是UNIX系统,所以在部分代码如果原封不动照搬到window系统执行的时候,会出现错误。因此,对于大部分的Windows系统初学者来说,这算是比较头疼的事情。而且,书上注释上也没有完全解释清楚如何在Windows系统内实现同样的操作。所以今天说一下关于如何做到在Windows系统内使用 Unix...

2020-01-13 10:36:17 1496 3

USDA食品数据库JSON文件.rar

其中,如果采用文件名foods-2011-10-03会运行出错的话,在我的相关文章已经给出解决办法。

2020-02-12

81.0.4044.69_chrome_installer and chromedriver.rar

81.0.4044.69版本的chrome_installer and chromedriver,需要自取,文章中也介绍如何可自行在网络上寻找相应资源的方法。

2020-03-24

DockerToolbox-18.03.0-ce.rar

DockerToolbox-18.03.0-ce,用于windows平台辅助安装Docker工具和Splash。

2020-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除