- 博客(13)
- 资源 (11)
- 收藏
- 关注
原创 计算机网络自顶向下方法套接字编程作业
本博客是针对,《计算机网络自顶向下方法》一书第二章后面套接字编程作业,所有代码均已上传至我的github:https://github.com/inspurer/ComputerNetwork所有代码均本人亲自编写,有问题欢迎评论交流;如需转载请联系:2391527690@qq.com作业1: Web服务器问题描述使用Python开发一个简单的Web服务器,它仅能处理一个请求,具体而言...
2018-11-30 22:34:02 12166 15
原创 Python 从生成器到协程
生成器通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这...
2018-11-30 13:26:23 541
原创 Python 函数参数的填坑之路
背景最近在看廖雪峰老师的python3教程之函数的参数受益匪浅,但是在实践的过程中,发现了一些不解之谜两个错误import _threadimport timedef func1(x): while x: print(x) x = x -1_thread.start_new_thread(function=func1,args=(5,),kwargs=None)time....
2018-11-30 13:26:14 1708
原创 python爬取学校教务管理系统
写这个爬虫的缘由以前用java写过一个爬取学校的教务系统的爬虫 https://blog.csdn.net/ygdxt/article/details/81158321,最近痴迷Python爬虫,了解到许多强大的库,想再一次用学校的教务系统做下测试。这一次我首先想到的是新的教务系统,这个难度更大,因为有了验证码识别反爬,由于我是用的tessocr库识别验证码,(具体配置过程可以参考我之前的博客...
2018-11-28 20:19:15 5366 5
原创 计算机网络daytime实现之java/python/c++版本
daytime介绍有一个有用的调试工具就是daytime服务。它的作用就是返回当前时间和日期,格式是字符串格式。基于TCP的daytime服务daytime服务是基于TCP的应用,服务器在TCP端口13侦听,一旦有连接建立就返回ASCII形式的日期和时间,在传送完后关闭连接。接收到的数据被忽略。基于UDP的daytime服务daytime服务也可以使用UDP协议,它的端口也是13,不过U...
2018-11-25 21:25:21 1099
原创 一文搞定python的日志自定义
在开发过程中,日志是一个避不开的话题,有的时候我们不需要控制台输出过多的信息,甚至不输出,当然,我们可以在控制台设置日志的等级来达到目的,但是,日志的保存,日志格式的重写,这些,就必须用python内建的logging模块来实现了。封装一个通用的日志脚本命名为logge.py,代码如下import osimport timeimport logging#返回一个logger实例,如果...
2018-11-24 19:18:30 2188
原创 python多进程与多线程
有关进程、线程、多进程、多线程线程与进程概念线程:是程序执行流的最小单元,是系统独立调度和分配CPU(独立运行)的基本单位。进程:是资源分配的基本单位。一个进程包括多个线程。区别1.线程与资源分配无关,它属于某一个进程,并与进程内的其他线程一起共享进程的资源。2.每个进程都有自己一套独立的资源(数据),供其内的所有线程共享。3.不论是大小,开销线程要更“轻量级”4.一个进程内的线...
2018-11-22 14:18:00 280
原创 java知识点查漏补缺
写此篇文章的缘由学习java已经一年有余了,所谓温故而知新,所以最近又在复习以前学过的java知识,同时更加深入了对java的学习,这期间的疑难问题和不熟悉没接触过的知识点,特开此贴纪录。顺便插一句,这是我以前的java课堂上学习的代码库,配套清华大学出版社陈国君主编的《java程序设计基础》,代码库包括一些书上给出的示例源程序(部分)、课后习题(部分)和实验室上机代码。传送门声明到目前为...
2018-11-16 20:12:14 303
原创 python爬取图虫网图库
本文首发于月小水长的个人博客如何使用下载工程源码点击下载或者git bash;git clone git@github.com:inspurer/PythonSpider.git下载相关依赖在命令行下依此输入pip install requests pip install pyquery 打开图虫网选择你喜欢的图库链接,比如https://tuchong.com/4...
2018-11-14 21:55:29 2349
原创 小程序json.parse错误
本文首发于:月小水长的个人博客:错误详情今天查看上线的微信小程序后台,发现了一个这样的错误:Unexpected token in JSON at position 52;at pages/send/send onShow function;at api request success callback function 于是我打开调试工具查看源代码并且调试:VM792:1 ...
2018-11-14 14:57:21 7512
原创 【持续更新】hexo next主题优化手册
本文最新更新于: 月小水长的个人博客前言开此贴的原因前几天博客崩了,重新搭建了这个博客站点。特开此贴记录next主题优化过程中遇到的问题,希望对大家有所帮助。 一些说明前期相关的Hexo安装、本地/远程部署教程可百度在此不再赘述。基于hexo-next v5.1.4,向上兼容,向下兼容性不确定,特此声明。我的博客本地根目录是D:\hexoblog站点配置文件全路径是D:\hex...
2018-11-12 21:08:29 652
原创 Windows下操作POP3
本文首发于个人网站:月小水长的个人博客Windows10下开启telnet服务在自学*《计算机网络-自顶向下方法》这本书中,telnet这个服务命令出现了好多次,开始在Ubuntu 12.0终端下输入telnet是有正确响应的,但是在windows 10命令行下输入提示找不到该命令,直到今天我才发现该服务在window 1o*下是默认关闭的,需要手动打开开启步骤如下1.用小娜以关键词功...
2018-11-10 13:31:38 2462
原创 python填坑之路:tesserocr配置
最近在学爬虫,在模拟登录网站的时候常常需要输入验证码,最常见的就是OCR(Optical Character Recognition,光学字符识别) ,于是乎了解到tesserocr这个库,但是安装的过程可谓坎坷。 大致的过程可参考博客:崔庆才的个人博客,但是最好注意以下几点将tesseract(注意不是tesserocr)的安装路径加入环境变量。 将tesseract安装...
2018-11-06 20:45:53 1525
某乎问题下回答数据集 CSV
2024-07-09
CUFE 思享推送经验心得
2024-07-09
BIT 思享推送经验心得
2024-07-09
RUC 思享推送经验心得
2024-07-09
2020 英雄联盟全球总决赛 SN vs DWG 约 50000 条弹幕文本
2023-10-30
Yelp 爬虫,洛杉矶 500 家饭店数据样例
2023-10-30
ChatGPT 话题数据集(英文)
2023-04-21
发布自己的轮子到 pypi 后 pip install 确是 not found 的原因
2022-10-11
TA创建的收藏夹 TA关注的收藏夹
TA关注的人