python
街道口扛把子
武汉大学炼丹师
展开
-
Harvard图书馆-Digital Collections-IIIF图像爬虫
上周老师让我做一个爬虫,刚开始就是说下载一个网站里的图片,可以跳转到其他页面继续下载,于是花了两三天时间做了出来。还好二月在家学习了一点爬虫的基础知识,上手工作还是比较顺利的,经过几天的实践,感觉python水平有所提高,爬虫也有了更多了解。这里需要做的爬虫任务比较地具体了,首先,从一个网址为起点,先把html下载下来,然后解析它里面的a和img标签,把他们的url存起来。对于a标签,还要记录一...原创 2020-04-25 12:09:13 · 1380 阅读 · 0 评论 -
记录一个python的正则匹配不到的事情
昨天在改一个图片爬虫(python)的时候,遇到了一个正则表达式匹配不到的链接,这里我要去匹配“Collection”这个单词。刚开始以为是正则表达式不对,但是改了好几次还是同样的结果,去匹配其他单词,可以匹配到其他相应的链接。后来用其他网址进行尝试,“Collection”是可以匹配到的,所以判断正则没有问题。然后把html存了下来再进行反复测试。最后发现,,,是因为正则里的“.”(点...原创 2020-04-25 12:01:05 · 1271 阅读 · 0 评论 -
Python 字符串前面加u,r,b,f的含义
1、字符串前加 u例:u"我是含有中文字符组成的字符串。"后面字符串以 Unicode 格式 进行编码,一般用在中文字符串前面,防止因为源码储存格式问题,导致再次使用时出现乱码。2、字符串前加 r例:r"\n\n\n\n” # 表示一个普通生字符串 \n\n\n\n,而不表示换行了。作用:去掉反斜杠的转义机制。(特殊字符:即那些,反斜杠加上对应字母,表示对应的特殊含义的,比如最常见...原创 2019-08-16 17:05:42 · 253 阅读 · 0 评论 -
jupyter notebook设置显示绘图
1.启动notebook2.输入%pylab3.选择 backend,输入%matplotlib qt5matplotlib 使用简明教程(一)-基础概念原创 2019-08-14 10:52:06 · 2809 阅读 · 0 评论 -
python 出现的问题:TypeError: 'float' object cannot be interpreted as an integer
python2的规则中,“/”是取整,是int型而在python3中,“/”符号是保留小数的,是float型解决:改为“//” 即可原创 2019-08-13 16:06:41 · 7293 阅读 · 0 评论 -
计算Python的代码块或程序的运行时间
转载自https://blog.csdn.net/chichoxian/article/details/53108365在很多的时候我们需要计算我们程序的性能,这个时候我们常常需要统计程序运行的时间。下面我们就来说说怎么统计程序的运行时间。2. 实现方法计算Python的某个程序,或者是代码块运行的时间一般有三种方法。方法一import datetimestart = datet...转载 2019-06-24 14:38:26 · 157 阅读 · 0 评论 -
pip conda 使用国内源加速
使用默认源有时候下载速度会很慢,所以找了一些国内的pip,conda源,下载的时候可以加速,使用起来也很简单。国内的pip源,如下:推荐使用清华源,支持包比较丰富conda操作单次使用 1 # conda install tensorflow -c https://mirrors.tuna.tsinghua...转载 2019-04-25 14:24:20 · 4004 阅读 · 0 评论 -
Counter most_common
转载自:https://blog.csdn.net/qq_39865495/article/details/81589372转载 2019-03-10 17:16:47 · 638 阅读 · 0 评论 -
pyinstaller打包.py文件为.exe可执行文件
安装pyinstallerpip install pyinstaller使用pyinstaller -F XXX.py -i icon.jpg-F是打包成单个exe,-i是设置exe图标。执行后,看到同级目录下多出几个文件。等待一段时间后。。最终失败。。=,=’...原创 2019-03-04 10:52:40 · 289 阅读 · 0 评论 -
Python 字符串型List转List
我在运行一段程序结束后,将一组数据存到了txt文件,然后需要读取这个文件,获得List。[34080, 302, 152, 70, 41, 29, 22, 13, 4, 1, 0, 5, 1, 2, 1, 1, 0, 0, 1, 0]如果直接转List,得到的是字符的List,['[', '3', '4', '0', '8', '0', ',', ' ', '3', '0', '2'.......原创 2019-02-21 10:10:30 · 1482 阅读 · 0 评论 -
matplotlib消除条形图bar的空隙
使用matplotlib绘制条形图时,默认的绘制plt.bar(x, y)在条形之间会有如下的间隙,如果需要将其消除,绘制时添加参数width=1.0即可,即plt.bar(x, y, width=1)消除间隔后如下图所示。...原创 2019-02-19 18:12:52 · 11450 阅读 · 1 评论 -
python中文标点转英文标点
unicode有个normalize的过程,按照unicode标准,有C、D、KC、KD四种,KC会将大部分的中文标点符号转化为对应的英文,还会将全角字符转化为相应的半角字符,比如:import unicodedatat = u'中国,中文,标点符号!你好?12345@#【】+=-()'t2 = unicodedata.normalize('NFKC', t)'''>>&a原创 2019-02-18 17:52:24 · 2101 阅读 · 0 评论 -
matplotlib修正坐标轴ylim的空白
用matplotlib绘制折线图后,我通过找y轴最小值的方式,绘制下图中的标注线,但是看到下面总是有一些空白,说明得到的y轴最小值不是在原点,就像x轴的第一个值一样。bottom, top = plt.ylim() #获得y轴最大最小值plt.plot([sLogit_max,sLogit_max],[bottom,start_logits[sLogit_max]], color ='red'...原创 2019-02-23 10:45:48 · 3400 阅读 · 0 评论 -
python 保存项目用到的包名生成requirements.txt
使用pipreqs包安装:pip install pipreqs在项目根目录下,打开控制台,输入:pipreqs ./ --encoding=utf8加–encoding=utf8为了避免编码错误编码错误如下成功:在根目录生成requirements.txt其中记录了项目中使用到的包。...原创 2019-02-21 17:38:56 · 772 阅读 · 0 评论