2019年04月_champion-yang

原创 tcp实现聊天机器人（图灵机器人）

TCP:面向连接的协议TCP把连接作为最基本的对象，每一条TCP连接都有两个端点，这种断点我们叫作套接字（socket），它的定义为端口号拼接到IP地址即构成了套接字，例如，若IP地址为192.3.4.16 而端口号为80，那么得到的套接字为192.3.4.16:80。三次握手1.最开始的时候客户端和服务器都是处于CLOSED状态。主动打开连接的为客户端，被动打开连接的是服务器。TCP服...

2019-04-24 23:16:05 2924

原创 Linux操作指南

Linux计算机的组成硬件软件操作系统管理资源，计算，管理及配置内存，决定系统资源所需的优先次序，基本的服务程序基本服务文件系统提供计算机储存信息的结构，信息储存在文件中，文件主要储存在计算机的内部硬盘里，在目录的分层结构中阻止文件。文件系统为操作系统提供了组织管理数据的方式设备驱动程序提供连接计算机的每个硬件设备的接口，设备驱动器使程序能够写入设备，而不需要了解...

2019-04-19 08:50:43 169

原创利用多线程和多进程实现文件的复制（简易版）

用到的模块os实现文件的读写操作mulitprocessing 创建进程对象threading 创建线程对象思考：怎样入手呢？要想进行文件的复制，那么我们先来了解一下如何进行文件的读写操作。就好像我们手动复制一个文件一样，第一步打开这个文件，读取这个文件的每一行，最后关闭这个文件。# 我们将写好的读写文件封装成一个函数，实现了文件的复制功能。方便以后调用。# rpath可以是要...

2019-04-18 20:22:39 1398

原创每日一问：python中的线程与进程，用进程来拷贝文件

线程：1.线程简介线程是cpu运行的最小单元。共享内存之间可以并发执行多任务。每一个线程都可以共享一个进程的资源。每个进程中最少包含一个线程，如何调度进程和线程完全由操作系统来决定。所有变量可以被线程共享。线程之间共享数据最大的危险在于：如果有多个线程同时启动处理同一个变量，会导致数据紊乱。2.创建线程通过模块_thread(偏向底层的低级模块，操作起来比较难)threadi...

2019-04-18 19:01:44 333

原创 Python爬虫--智联招聘职位和公司信息爬取

用scrapy框架进行爬取目录结构：1. items.py 文件事先定义好我们要进行爬取的信息# -*- coding: utf-8 -*-# Define here the models for your scraped items## See documentation in:# https://doc.scrapy.org/en/latest/topic...

2019-04-16 09:15:35 2350

原创通过腾讯招聘案例理解parse()方法的工作机制

案例：腾讯招聘网自动翻页采集创建一个新的爬虫：scrapy genspider tencent "tencent.com"编写items.py获取职位名称、详细信息、class TencentItem(scrapy.Item): name = scrapy.Field() detailLink = scrapy.Field() positionInfo =...

2019-04-14 11:17:59 298

原创 Python爬虫框架scrapy入门

Scrapy 框架 Scrapy是用纯Python实现一个为了爬取网站数据、提取结构性数据而编写的应用框架，用途非常广泛。框架的力量，用户只需要定制开发几个模块就可以轻松的实现一个爬虫，用来抓取网页内容以及各种图片，非常之方便。 Scrapy 使用了 Twisted['twɪstɪd](其主要对手是Tornado)异步网络框架来处理网络通讯，可以加快我们的下载速度，不用...

2019-04-14 09:54:56 146

原创每日一问：Python生成器和迭代器，装饰器，with上下文管理工具

本文章在博客园也系本人发表点击查看1.生成器：　　1.1 起源：　　　　　　如果列表中有一万个元素，我们只想要访问前面几个元素，对其进行相关操作，通过for循环方式效率太低，并且后面的元素会浪费内存，还会受到内存限制，所以产生生成器来解决这个问题。　　1.2 啥是生成器：　　　　　　通过某种算法推演出我们所需要的内容，而不必创建所有的列表元素。这种一边循环一遍计算的机制叫...

2019-04-11 14:08:04 242

原创 python爬虫小练习--爬取小说，图片，视频

爬取笔趣网的小说，狂神，并保存在本地import requestsfrom bs4 import BeautifulSoupimport time# lxml 只会局部遍历，而Beautiful Soup 是基于HTML DOM的，会载入整个文档，解析整个DOM树，因此时间和内存开销都会大很多，所以性能要低于lxml。# 爬取笔趣网下的狂神小说,# 一章的内容'''if __...

2019-04-07 11:42:01 3578

原创分享一个小案例--电子琴的制作

简单电子琴，可以实现按键1-8发出不同的声音来！用到技术：html+css+js<!doctype html><html lang="en"><head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-wid...

2019-04-06 22:48:21 1235

原创 python爬虫系列--lxml（etree/parse/xpath)的使用

lxml：python 的HTML/XML的解析器官网文档：https://lxml.de/使用前，需要安装安 lxml 包功能：1.解析HTML：使用 etree.HTML(text) 将字符串格式的 html 片段解析成 html 文档2.读取xml文件3.etree和XPath 配合使用lxml-etree的使用：加载本地中的htmletree.HTML(te...

2019-04-05 12:12:29 40911 12

原创 python模块系列-OS模块

Python的os模块是一个跟操作系统结合比较密切的模块，里面提供了很多很多比较有用的方法。 os.getcwd() 获取当前工作目录，即该Python脚本运行时的目录 print(os.getcwd())结果：/Users/ssspure/PycharmProjects/File/osmodule 2. os.chdir("dirname") 切换到指定...

2019-04-03 22:36:46 764

原创 Python常见面试题集锦

1.一行代码输出九九乘法表print ('\n'.join([' '.join(['%s*%s=%s '%(j,i,j*i) for j in range(1,i+1)]) for i in range(1,10)]))分析：利用Python中的模板字符串，列表生成式，还有Python中的join方法（Python join() 方法用于将序列中的元素以指定的字符连接生成一个新的字...

2019-04-02 19:26:12 500

原创 Python中面向对象之单例设计模式

# 面向对象的单例设计模式# 普通模式class Person: def __init__(self,name,age): self.name = name self.age = ageobj1 = Person('小明',20)obj2 = Person('小红',25)obj3 = Person('小蓝',30)print(id(...

2019-04-02 14:26:09 209

原创 Python基础篇二

敬请期待运算符1.算数运算符 + - * / % // ** + 拼接 / 结果都为浮点型 // 地板除 ** 幂运算2. 比较运算符 > >= < <= != == 子主题 23. 赋值运算符 = += ...

2019-04-02 14:23:54 156

原创 Python语句中的文件操作及异常处理

with--as 用法请点击移步文件操作的步骤： 1.打开文件 open(file, mode='r') r r+ w w+ a a+ 2.读写内容读： ...

2019-04-02 08:50:09 435

原创 Python常用的魔法方法

详情请点击

2019-04-01 15:26:43 154

champion