其他
spider_fu
这个作者很懒,什么都没留下…
展开
-
简书图片不显示
简书查看多次后就会被屏蔽ip导致图片不显示f12打开开发者界面到console输入下列代码:回车即可解决。如果不行可以刷新一下页面。原创 2022-06-17 20:10:31 · 1113 阅读 · 1 评论 -
为什么要归一化
归一化方法很多不赘述,主要说明为什么要做归一化,什么情况下需要归一化。归一化是什么归一化就是特征向量中所有的值映射到0-1之间什么情况下需要归一化极端值较多,最大值和最小值之间差距较大;不同特征之间差距较大,不归一化会导致学习到数值较大的特征更多一些。为什么做归一化就是避免前面所产生的问题。...原创 2021-05-31 16:13:38 · 941 阅读 · 0 评论 -
数学不常见符号记录大全(持续更新)
查询导航II()II()示性函数,括号内条件成立,则为1,括号内条件不成立则为0.参考百度百科示性函数。示例:出自西瓜书错误率的定义,公式2.4原创 2020-12-30 12:45:56 · 2289 阅读 · 0 评论 -
postman测试get和post请求接口
在日常学习和工作中经常会使用到接口,包括接口的编写,接口的调用,postman可以很方便快捷的测试接口是否正常,也能查看返回的数据,判断返回数据是否符合需求。常用的请求接口主要有get请求和post请求使用postman测试get接口选择get请求方式输入网址可以在params中输入参数,一对key,value为一个参数,也可以直接在网址上添加到后面,直接添加“?",然后接参数,用“=”链接,参数之间用“&”链接。然后点击post就可以进行测试了。使用postman测试post接原创 2020-11-18 16:03:32 · 1612 阅读 · 0 评论 -
定时任务导致阿里云服务内存总不足的问题(no space left on device)
我们常使用的crontab,很有可能时导致这个问题的关键,特别是邮件的定时,后来弃用掉就会导致产生dead.letter,如果你用过邮件定时,基本就是这个原因导致的。解决办法:查找dead.letter的位置,可以使用ls -lht查看文件大小,哪个文件夹大哪个就很有可能有这个文件,然后不断进去找total 1.1Mdrwxrwxrwt. 4069 root root 1016K Oct 16 17:55 tmpdr-xr-x---. 16 root root 4.0K Oct 1原创 2020-10-16 18:11:24 · 446 阅读 · 0 评论 -
微博粉丝走势监控-数据处理
数据处理这里主要说一下处理超话的那些文字,主要采用正则爬取下来的数据分为两个部分1、排名2、阅读,帖子,粉丝排名排名,不管是是什么排名都是“XX榜No.xx",如果想要完整的,就直接不处理,毕竟榜单都不一样,留着也不错,我本人就没处理,如果只想要排名import rerank = re.match('.*榜No\.(\d*)', text).group(1)text为爬取的文本,即“XX榜No.xx",rank为排名具体数字阅读,帖子,粉丝因为这三个部分写在了一起,可以同时提取出来原创 2020-07-31 14:46:52 · 561 阅读 · 0 评论 -
python-docx设置文字突出显示,即高亮
# -*- coding: utf-8 -*-"""@Time : 2020/2/12 17:22@Author : Spider fu@File : highlight_color.py"""from docx import *file = Document()p = file.add_paragraph("第一段")# 添加段落run = p.add_run("绿色")...原创 2020-05-27 17:19:25 · 3677 阅读 · 1 评论 -
python将word文档指定内容标红以及设置文字突出显示,即高亮
使用docx的包,这里包名为:python-docxfrom docx.shared import RGBColor,Ptdef set_run(run,font_size,bold,color): run.font.size =font_size run.bold=bold run.font.color.rgb=color定义一个方法,获取文本的stylefil...原创 2020-01-25 10:50:29 · 7659 阅读 · 3 评论 -
定时爬虫
设置主函数,import osimport timewhile True: os.system("scrapy crawl spider") time.sleep(86400) #每隔1天运行一次 24*60*60=86400s这种方式可以实现每隔一天爬取一次,但每次都会偏移爬取所用的时间。如果避免这种偏移,可使用crontab在linux系统中,写一个脚本corn.sh#!...原创 2020-01-02 16:43:16 · 669 阅读 · 0 评论 -
教室预约系统
目录前言需求思路需求分析,以及对应功能的实现封装优化用户名密码的实现展示各个时段是否被占用的表格打包成exe后记前言上个月,朋友的学校需要做实验,实验器材是固定的,因此为了避免做实验冲突,需要提前预约,他们是采用人工用Excel表格的方式,我看了一下需求,做了一个简单的 教室预约软件,实现了需求。需求提出的需求,大概有以下几点:每天从8点开始,23点结束,每两个小时为一个时间段,最后一...原创 2019-12-17 16:01:57 · 7823 阅读 · 6 评论