阿瞒oman-CSDN博客

原创任选一个英文文本，如何统计其中单词出现的个数

思路：首先要读取英文文本.txt，然后对读取文本进行“空格化”，方便单个单词的识别，最后将数据写入新文本中。代码如下import collectionswith open('test.txt','r',encoding='UTF-8') as f: String=f.read().split(' ')text = collections.Counter(String)with open('result.txt','w') as r: for key,value in text.i

2020-06-29 21:19:56 1333

原创发送短信验证码时触发天级流控Premit：10

今天在用手机注册账号的时候遇到的。问题的结果就是发不出验证码，会提示触发天级流控premit：10错误。原因在此简单说一下：申请验证码的手机号已经多次并且超出运营商业务限流程度，所以你再申请，就不给你发了。解决办法目前我的解决办法就是换其他手机号注册，就可以了。如果是解决限流的手机号问题，目前我还没找到具体有效方法，如果您有建议，可在下方留言同大家分享。tips：如果是私人手机号出现...

2020-04-13 09:42:34 28406 1

原创 python3版本安装aiohttp库

在安装aiohttp库中遇到的一些问题并已经解决（本人用的是python 3.8版本）首先用pip3命令安装pip3 install aiohttp但是运行后，出现问题运行超时了，python安装库的同通病：网速不稳定问题。但是我没有去用镜像网安装，而是再次试一次，继续pip3 命令这次终于下好了aiohttp.whl文件，但是又自动下了另一个库——yarl，结果又因为网络问题中...

2020-04-04 15:10:13 4282 2

原创 python爬虫代理出现计算机积极拒绝问题解决

学习爬虫代理中，出现了如下问题from urllib.error import URLErrorfrom urllib.request import ProxyHandler,build_openerproxy = '127.0.0.1：9743'proxy_handler = ProxyHandler({ 'http':'http://' + proxy...

2020-04-03 18:13:00 54483

原创 selenium爬取淘宝商品

对于《python3网络爬虫实战分析》中selenium爬取淘宝商品信息代码进行修改。原代码from selenium import webdriverfrom selenium.common.exceptions import TimeoutExceptionfrom selenium.webdriver.common.by import Byfrom selenium.webdriv...

2020-03-27 19:27:40 1265 1

原创 Python3在连接Splash端口时遇到目标计算机积极拒绝问题

问题检索={requests.exceptions.ConnectionError: HTTPConnectionPool(host=‘localhost’, port=8050): Max retries exceeded with url: /render.html?url=https://www.baidu.com (Caused by NewConnectionError(’<url...

2020-03-27 11:44:03 723 1

原创安装Docker（Docker Toolbox）与Splash库

想要安装Splash库，先安装Docker。1.Docker安装但是面对windows运行环境，大部分的情况来看，需要先安装Docker Toolbox才可以。我是win10系统，安装了Docker for Windows，但是不能用。首先可以官网下载Docker Toolboxhttps://docs.docker.com/toolbox/toolbox_install_windows...

2020-03-26 18:48:33 796

原创 python3爬虫给seleium库所遇到的问题

学习《python3网络爬虫实战分析》的第七章selenuim库中出现的问题。错误检索={1.Warning (from warnings module):browser = webdriver.Chrome(chrome_options=options)DeprecationWarning: use options instead of chrome_optionsTraceback ...

2020-03-24 16:37:46 9617 4

原创安装MySQL库引发的惨案

问题检索={1.pymysql.err.OperationalError: (2003, “Can’t connect to MySQL server on ‘localhost’ ([WinError 10061] 由于目标计算机积极拒绝，无法连接。)”)2.pymysql.err.OperationalError: (1045, “Access denied for user ‘root’...

2020-03-20 23:55:35 259

原创《python3网络爬虫实战分析》第三章重难点总结+猫眼电影爬虫代码

此处seq可以省略不用，因为会报错：TypeError: ‘seq’ is an invalid keyword argument for print()cookies.txt文件保存在你正在编程python文件运行的文件夹中在维持知乎登陆方法介绍中，从网页中复制的headers内容，其中Cookie、Host和user-agent 后不能出现空格，不然报错。但是爬取的页面，却无法...

2020-03-18 09:58:13 1222

原创目前最稳妥最安全的解决win10自动更新问题的方法

我在网上看了不少关于解决win10自动更新的办法，但都是有缺点的。比如，禁止两天后有自动更新、开机后蓝屏、电脑偶尔死机等等。这些关闭更新的技术或多或少都有些后遗症，并不可靠。我思来想去，难道就没有更安全的解决办法？我们遇到的问题是，win10开机自动更新，会影响我们的正常的工作和学习进程。在紧急的情况下，等它更新好了，黄花菜都凉了。所以，既然阻止不了win10更新，那就转变问题，如何不让w...

2020-03-15 12:22:57 1069

原创通过requests库re库进行淘宝商品爬虫爬取（对中国大学mooc嵩天老师爬虫进行修改）

中国大学mooc上的爬取淘宝页面商品已经因为淘宝的维护而无法爬取比如，只出现个表头：这是我按照嵩天老师代码学习，遇到的问题。原代码如下：import requestsimport redef getHTMLText(url): try: r= requests.get(url,timeout=30) r.raise_for_status(...

2020-03-09 21:38:48 3972 34

原创 python爬虫学习第一天笔记

1.我所看的教程，所用的是python3之前版本，所以涉及到的urllib库命令都已经更换了，所以要学会看python源文档是一个必须要做的工作。部分命令如下，方便以后查询：python2之urllib命令 Python3之urllib命令urllib.urlretrieve() urllib.request.urlretrieve()urllib.urlcleanup() ...

2020-02-29 20:39:26 329

原创 USDA食品数据库示例中资源缺失和解决办法

第七章中示例：USDA食品数据库所给的关于原始数据（食品数据库的JSON版）的资源链接，经过搜索，已经失效了（第二版）。后经努力寻找，终于找到一个资源，现分享给大家，免去学习数据分析中去寻找资料而劳苦伤神。上传了CSDN，还在审核中，不知道能不能成功。放在GitHub中，可能网速下载较为慢，已经压缩成rar格式。https://github.com/Theo-yu/python-for-d...

2020-02-12 17:43:38 515

原创 AttributeError: module 'pymongo' has no attribute 'Connection'

学习ipython数据分析（利用python进行数据分析第二版）中，存取MongoDB中的数据，书中程序如下：但是在运行第二行代码的时候，出现了问题：意思是说pymongo不能用connection这一功能。从前一篇文章遇到的错误中可以推断出，这也许是因为版本更新的问题导致个别函数名称有所更改。因此只好查阅pymongo的操作手册：查看后得知，函数名已经更改。所以，正确更正如下：原来...

2020-01-14 10:29:24 1161

原创 DataFrame内pickle序列化的存储（save）和读取（load）问题

关于pickle序列化存储问题，书上程序如下：但是在运行的时候出现如下错误：意思是说，DataFrame里面没有‘save’这一功能属性，也就是不能用。后来查阅后操作手册后发现，原来个别函数的属性功能会随着版本更新而变化。显然，此书中相应的命令更改为：存储 frame.save →frame.to_pickle读取 frame.load → frame.read_pickle...

2020-01-13 10:46:36 2940

原创 NameError:name 'sys' is not defined

在学习python数据分析的数据加载、存储与文件格式，170页，想实现如下程序效果：但是却出现错误：图片内的sys.stout应该改成sys.stdout错误意思是说‘sys’没有定义过。关键是翻阅此书籍，愣是没找到提前定义‘sys’的代码。所以，为了防止出现错误，应该事先定义，如下：再次出入代码运行：成功。...

2020-01-13 10:41:40 18360

原创《python数据分析》第六章pd.read_csv()函数读取文本时候出现的错误

在建立好csv文档之后，运用pd进行读取，并通过read_csv()函数进行标题设定。但是按照书本上进行，却遇到了这种情况：一是多读取文本信息存在转义符——\t；二是标题a、b、c、d和message都跑到了后面，造成行列输错NaN。其问题在于ex1.csv文档兼容问题。如果出现这中问题的时候去打开该文档，会出现如下情况：原本数据理应单格存放的，但是现在却全部缩在一个格子里。这是由于c...

2020-01-13 10:39:22 1516

原创《Python数据分析》中的Unix！cat 命令与Windows！type命令的转变问题

在《Python数据分析》的第六章关于读取文本格式介绍部分，涉及到使用cmd命令。但因为作者原使用的是UNIX系统，所以在部分代码如果原封不动照搬到window系统执行的时候，会出现错误。因此，对于大部分的Windows系统初学者来说，这算是比较头疼的事情。而且，书上注释上也没有完全解释清楚如何在Windows系统内实现同样的操作。所以今天说一下关于如何做到在Windows系统内使用 Unix...

2020-01-13 10:36:17 1513 3

USDA食品数据库JSON文件.rar

其中，如果采用文件名foods-2011-10-03会运行出错的话，在我的相关文章已经给出解决办法。

2020-02-12

81.0.4044.69_chrome_installer and chromedriver.rar

81.0.4044.69版本的chrome_installer and chromedriver，需要自取，文章中也介绍如何可自行在网络上寻找相应资源的方法。

2020-03-24

DockerToolbox-18.03.0-ce.rar

DockerToolbox-18.03.0-ce，用于windows平台辅助安装Docker工具和Splash。

2020-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人