stormztt

眼过千遍,不如手过一遍!

公众号:Python知音阁

Python知音阁 为了更方便的管理自己的学习记录,我以后将在公众号"Python知音阁"分享我的学习记录,学习经验,踩过的坑等等。公众号文章主要方向是:Python基础、Python Django后端(使用Django RESTframework框架)、Linux基础、数据库...

2019-06-05 17:48:30

阅读数 46

评论数 0

Django QuerySet 进阶

更多内容,欢迎关注微信公众号:Python知音阁。 什么是QuerySet QuerySet是Django提供的强大的数据库接口(API)。正是因为通过它,我们可以使用filter, exclude, get等方法进行数据库查询,而不需要使用原始的SQL语言与数据库进行交互。从数据库中查询出来的...

2019-08-02 18:08:24

阅读数 24

评论数 0

MySQL数据库开发的三十六条军规

写在前面的话: 总是在灾难发生后,才想起容灾的重要性; 总是在吃过亏后,才记得曾经有人提醒过。 (一)核心军规 (1)不在数据库做运算 cpu计算务必移至业务层; (2)控制单表数据量 int型不超过1000w,含char则不超过500w; 合理分表; 限制单库表数量在300以内; (3)控制列数...

2019-07-06 17:42:08

阅读数 28

评论数 0

spring boot项目的结构和他们之间的关系

分层 描述 作用 domian 实体类 数据库表的实体 dao 数据访问接口 提供一个访问数据库实例的接口 service 服务接口 提供一个实现为控制器提供服务的实例的接口 serviceImp 服务的实例 调用dao的实例的方法,为控制提供服务 controller 前...

2019-04-29 17:02:03

阅读数 66

评论数 0

解决lxml安装后无法import到etree模块的问题

使用from lxml import etree 现红: 解决: python 3.5之后的lxml中不能再直接引入etree,换了一种方法引入: from lxml import html etree = html.etree

2019-04-26 10:19:40

阅读数 209

评论数 0

避免反爬,使用代理的基本原理

文章摘录自:《Python3网络爬虫开发实战》 我们在做爬虫的过程中经常会遇到这样的情况,最初爬虫正常运行,正常抓取数据,然而一杯茶的功夫可能就会出现错误,比如403 Forbidden,这时候打开网页一看,可能会看到“您的IP访问频率太高”这样的提示。出现这种现象的原因是网站采取了一些反爬虫...

2019-04-24 15:46:19

阅读数 36

评论数 0

CSS选择器的其他语法规则

2019-04-24 15:02:33

阅读数 20

评论数 0

Content-Type和POST提交数据方式的关系

Content-Type 提交数据的方式 application/x-www-form-urlencoded 表单数据 multipart/form-data 表单文件上传 application/json 序列化JSON数据 text/xml XML数据 在爬虫中,如果要...

2019-04-24 14:39:14

阅读数 12

评论数 0

htpp响应状态码: 常见的错误代码及错误原因

状态码 说明 详情 100 继续 请求者应当继续提出请求。服务器已收到请求的一部分,正在等待其余部分 101 切换协议 请求者已要求服务器切换协议,服务器已确认并准备切换 200 成功 服务器已成功处理了请求 201 已创建 请求成功并且服务器创建了新的资源 202 已接受...

2019-04-24 14:29:33

阅读数 31

评论数 0

解决使用tesserocr.image_to_text(image)和(tesserocr.file_to_text('image.png')等错误问题

用例子验证如何使用:我们找到一个验证码图片:image.jpg,下载到本地磁盘,用代码进行验证: 1 import tesserocr 2 from PIL import Image 3 image=Image.open(‘image.jpg‘) 4 print(tesserocr.image_...

2019-04-24 11:38:46

阅读数 193

评论数 0

解决Python3.6安装使用tesserocr文件时报错“error: Microsoft Visual C++ 14.0 is required.“

使用pip install tesseroc安装时,报错L: 解决办法: 我们在PowerShell下使用pip3 install tesserocr pillow 命令安装 tesserocr时通常会报错:“error: Microsoft Visual C++ 14.0 is requir...

2019-04-24 11:21:01

阅读数 35

评论数 0

Python网络爬虫——周报2

一、本周情况: 1.1 书籍学习 第二部分: 高级数据采集 数据清洗 自然语言处理 穿越网页表单与登录窗口进行采集 采集javascript 图像识别与文字处理 避开采集陷阱 用爬虫测试网站 远程采集 二、笔记: 本部分练习代码在github仓库:https://github.co...

2019-04-23 18:52:34

阅读数 26

评论数 0

Python网络爬虫——周报1

本周情况: 一、书籍学习-《Python网络数据采集》 第一部分:创建爬虫 初见网络爬虫 复杂的HTML解析 开始采集 使用API 存储数据 读取文档 课程笔记: 本部分练习代码在github仓库:https://github.com/Alextaotao/Python-net...

2019-04-23 18:38:08

阅读数 42

评论数 0

理解Session和Cookie机制

什么时候不能用Cookie,什么时候不能用Session? 一、会话 会话(Session)跟踪是Web程序中常用的技术,用来跟踪用户的整个会话。 常用的会话跟踪技术是 Cookie 与 Session 。 Cookie: 通过在客户端记录信息确定用户身份; Session: 通过在服务器端记...

2019-04-23 18:13:22

阅读数 30

评论数 0

Spring Boot打造个人博客系统(总体分析)

一、功能概述: 1.1 核心功能 1.2 用户管理: 1.3 安全设置: 1.4 博客管理: 1.5 评论管理: 1.6 点赞管理: 1.7 分类管理: 1.8 标签管理: 1.9 首页搜索: 二、核心技术: ...

2019-04-22 22:43:07

阅读数 91

评论数 0

Git教程

相关链接内容: Git 知识点 Git速成 Git进阶 Git Book 廖雪峰Git 初识GitHub 加入 GitHub 向 GitHub 提交代码 团队合作利器 Branch GitHub 常见的几种操作 如何发现优秀的开源项目? 教你一招最屌...

2019-04-21 10:09:12

阅读数 31

评论数 0

Pycham导出项目依赖,安导入项目依赖->requestmnt.txt

导出: pip freeze > requirements.txt # 这种方式推荐配合 virtualenv ,否则会把整个环境中的包都列出来 导入: pip install -r requriements.txt 即可安装所有依赖 ...

2019-04-21 10:04:26

阅读数 61

评论数 0

Socke编简单模拟客户端和服务端通信

模拟服务端: # -*- encoding: utf-8 -*- """ @project = imooc_pythonSpider @file = socket_server @auther = ztt @create_time = '2019/4/15 14:56...

2019-04-15 21:33:12

阅读数 21

评论数 0

Scrapy爬虫框架环境搭建

系统:win10平台 python版本:3.6 1. 下载并安装 pywin32: 进入https://sourceforge.net/projects/pywin32/files/,按照下图目录点击pywin32,选择Build 221,找到自己对应版本的pywin32点击连接即可自己下...

2019-04-13 18:24:45

阅读数 24

评论数 0

“深网” && “暗网”

深网是网络的一部分,与浅网(surface Web)对立。浅网是互联网上搜索引擎可以抓到的那部分网络。据不完全统计,互联网中其实约 90% 的网络都是深网。因为谷歌不能做像表单提交这类事情,也找不到那些没有直接链接到顶层域名上的网页,或者因为有 robots.txt 禁止而不能查看网站,所以浅网的...

2019-04-13 16:40:36

阅读数 1136

评论数 0

提示
确定要删除当前文章?
取消 删除