python
Week.D.Awn
人云亦云,并不会让你变得有多优秀,而会让你越来越随大流。
展开
-
JsonItemExporter 和 JsonLinesItemExporter 保存数据的异同
在 scrapy 爬虫框架的 pipeline 管道中进行持久化数据,一般会用到 ItemExporter 的 JsonItemExporter 和 JsonLinesItemExporter 这两种方式。原创 2022-08-18 11:25:16 · 236 阅读 · 0 评论 -
python爬虫利器之scrapy的基本教程
Scrapy 是一个十分强大的爬虫框架,使用 pip 来安装 scrapy 需要安装大量的依赖库,至少需要的依赖库有 Twisted,lxml,pyOpenSSL。在提取数据后,该parse()方法查找到下一页的链接,使用该 urljoin()方法构建一个完整的绝对 URL(因为链接可以是相对的)并产生一个到下一页的新请求,将自己注册为回调来处理下一页的数据提取并保持爬取通过所有页面。它们必须是 Spider 的子类并定义初始请求,可选的是如何跟随页面中的链接,以及如何解析下载的页面内容以及提取数据。...原创 2022-08-12 10:46:32 · 1347 阅读 · 0 评论 -
python将list转换为csv
将如下列表数据转为csv文件。原创 2022-07-26 11:26:26 · 8684 阅读 · 0 评论 -
python中list的五种查找方法
Python中是有查找功能的,五种方式in、notin、count、index,find前两种方法是保留字。原创 2022-07-26 10:16:38 · 15935 阅读 · 0 评论 -
jupyter notebook/lab 输出显示每行变量
jupyter notebook/lab 默认输出只显示最后一行的变量在文件的最上方添加:from IPython.core.interactiveshell import InteractiveShellInteractiveShell.ast_node_interactivity = "all" 即可输出显示每行代码如果要回复默认,改为如下即可:from IPython.core...原创 2020-02-06 12:23:11 · 3769 阅读 · 0 评论 -
关于“AttributeError: ‘numpy.ndarray‘ object has no attribute ‘lower‘”的解决办法
一般报这个错是因为把numpy的array当成list来使用了。解决办法:把array变量转化为list。import numpy as npmyArray = np.array(**)......#看这里myArray = myArray.tolist().........原创 2019-08-30 14:25:30 · 28986 阅读 · 1 评论 -
python下载的第三方库安装说明,如:.whl格式和.tar.gz的安装说明
版权说明:未经许可,不得转载使用的Python的时候,经常会用到第三方库的支持。这些库文件都需要到Python的第三方库的官网上下载,然后进行相应的配置才能正常使用。在官网里下载的很多第三方库都是.whl或者.tar.gz格式的。(exe的直接安装 就行)在刚开始的时候,我也不知道具体该怎么配置使用。现在对这些已经是轻车熟路了,我在这里记录下配置方法,供大家参考。对于...原创 2017-05-20 11:17:40 · 6181 阅读 · 0 评论 -
关于“‘c‘ argument has 1 elements, which is not acceptable for use with ‘x‘ with size 300“的解决办法
以下代码plt.scatter(X[0, :], X[1, :], c=y, cmap=plt.cm.Spectral)报错:ValueError: RGBA sequence should have length 3 or 4During handling of the above exception, another exception occurred:......Val...原创 2019-08-01 15:20:34 · 5380 阅读 · 5 评论 -
关于scipy1.3.0中被弃用的imread,imresize的替代方案
SciPy最新官方文档的说明(20190730):Functions from scipy.interpolate (spleval, spline, splmake, and spltopp) and functions from scipy.misc (bytescale, fromimage, imfilter, imread, imresize, imrotate, imsave, i...原创 2019-07-30 14:24:46 · 29648 阅读 · 40 评论 -
关于Django报错“Did you install mysqlclient or MySQL-python?”的解决办法(前提:mysqlclient&MySQL都已经安装)
环境说明:win10 专业版python 2.7.16django 1.11.9遇到的问题:python的库中已经安装了mysqlclient&MySQL两个库,debug的时候还是报错:No module named MySQLdb.Did you install mysqlclient or MySQL-python?解决方案:在django项目的根目录下的sett...原创 2019-07-19 10:05:18 · 4256 阅读 · 0 评论 -
pythonic写法
变量交换pythonic写法:a, b = b, a普通写法:tmp = a;a = b;b = tmp;循环遍历区间元素# 生成器与列表更加节省内存# range(start, end, step)# [start, end) 包含开头不包含结尾for i in range(1, 1000, 2) # python3for i in range(6) # python...原创 2019-01-18 11:16:21 · 421 阅读 · 0 评论 -
读取csv文件并转换为DataFrame格式
逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。准备好csv文件。csv_file = "yourfilename.csv"csv_data = pd.read_csv(csv_file, low_memory = False)#防止弹出警告csv_df = ...原创 2018-08-03 15:55:03 · 65086 阅读 · 3 评论