2018年07月_我想和你写代码

10月 09月 08月 07月 06月 05月

原创 PyQuery

什么是PyQuery强大又灵活的网页解析库。如果熟悉jquery，PyQuery将是绝佳的选择安装PyQuerypip3 install pyquery字符串初始化html = ''' <div> <ul> <li class="item-0">first item</li> <li class="i...

2018-07-16 15:36:53 205

原创 BeautifulSoup库详解

基本使用from bs4 import BeautifulSoup html = ''' <html><head><title>The Dormouse's story</title></head> <body> <p class="title" name="dromouse"&

2018-07-16 11:35:36 232

原创正则表达式

常用正则表达式匹配中文字符[\u4e00-\u9fa5]匹配双字节字符(包括汉字在内)[^\x00-\xff]匹配空白行\n\s*\r匹配Email地址[\w!#$%&'*+/=?^_`{|}~-]+(?:\.[\w!#$%&'*+/=?^_`{|}~-]+)*@(?:[\w](?:[\w-]*[\w])?\.)+[\w](?:[\w-]*[\w])?匹配网址URL[a-zA-z]...

2018-07-13 10:57:26 1031

原创 Requests库详解

什么是Urllib内置的一个http请求库，不需要额外的安装，不需要了解底层到底怎么实现。urllib.request 请求模块urllib.error 异常处理模块urllib.parse url解析模块urllib.robotparserimport urllib2 response = urllib2.urlopen('http://www.baidu.co...

2018-07-12 17:27:13 253

爬虫基本原理爬虫是请求网站并提取数据的自动化程序爬虫的基本流程发起请求：通过http库想目标站点发送请求如果服务器响应，会得到一个response解析内容保存数据，保存成文本或者至数据库#!/usr/bin/env python # encoding: utf-8 import requests response = requests.get('http://www.baidu.com') pr...

2018-07-12 15:49:53 382

xlsx.full.min.js

2020-06-19

Jsp+Servlet+JDBC新闻发布系统2.1

查看详情请搜索文章[Jsp+Servlet+JDBC新闻发布系统2.0] 2018-6-13更新了点内容，重新上传，之前的删除了。内容：修复了一些bug，加了二级评论。

2018-06-23

敏感词过滤

把网上的sql整理成的excle，建账表，复制完往数据库一丢就行。 create table TBL_SENSITIVE_WORD ( word_id VARCHAR2(32) primary key, badword VARCHAR2(765) )

2017-01-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

l4642247的专栏

原创 PyQuery

原创 BeautifulSoup库详解

原创正则表达式

原创 Requests库详解

原创 Python笔记本

xlsx.full.min.js

Jsp+Servlet+JDBC新闻发布系统2.1

敏感词过滤

空空如也

原创 PyQuery

原创 BeautifulSoup库详解

原创 正则表达式

原创 Requests库详解

原创 Python笔记本

xlsx.full.min.js

Jsp+Servlet+JDBC新闻发布系统2.1

敏感词过滤

空空如也

原创正则表达式