- 博客(11)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 python:多线程爬取糗事百科
多线程爬取糗事百科 多线程爬取糗事百科 # -*- coding:utf-8 -*- #使用了线程库 import threading #请求处理 import requests #队列 from Queue import Queue #解析库 from lxml import etree #json处理 import json import time #标志位 ...
2018-04-12 22:30:34 596 1
原创 爬虫总结(二)
爬虫总结 爬虫总结 正则表达式 Xpath lxml库 CSS选择器:BeautifulSoup4 JSON 正则表达式 1.Python的re模块 在Python中,我们可以使用内置的re模块来使用正则表达式. 注意:正则表达式使用对特殊字符进行转义,所以如果我们要使用原始字符串,只需要加一个r前缀,示例: r'hello\tworld' 2.re模块的一般使用...
2018-04-12 21:31:24 318
原创 学习过滤器
过滤器 过滤器 引入 什么是过滤器 过滤器的生命周期 在web.xml文件中配置过滤器 FilterConfig对象 FilterChain对象 引入 在servlet中获取用户参数数据 : request.getParameter(“参数名”) 遇到参数内容中文乱码问题 post提交: request.setCharacterEncoding(“utf-...
2018-04-11 16:22:57 216
原创 学习IO流
IO流 IO流 使用FileWriter复制文件 使用缓冲区,提高效率 使用java内置的高效字节流完成文件复制 使用LineNumberReader打印行数 练习:文件深度遍历 练习:删除一个带内容的目录 练习:程序计数器 练习:获取指定目录下,指定扩展名的文件 练习:文件切割器 练习:碎片文件合并 使用FileWriter复制文件 public static void...
2018-04-11 11:23:12 249
原创 爬虫总结(一)
爬虫总结(一) 爬虫总结(一) urllib2模块 urllib2直接访问url urllib2构造header来反爬虫 自定义handler构造具有代理功能的opener 自定义handler构造具有保存cookie功能的opener Requests模块 Requests引入 Request访问url urllib2模块 urllib2直接访问url res...
2018-04-10 22:10:36 564
原创 Cookie,Session,Token
1.什么是Cookie Session Token 1.什么是Cookie Cookie 技术产生源于 HTTP 协议在互联网上的急速发展。随着互联网时代的策马奔腾,带宽等限制不存在了,人们需要更复杂的互联网交互活动,就必须同服务器保持活动状态(简称:保活)。 于是,在浏览器发展初期,为了适应用户的需求技术上推出了各种保持 Web 浏览状态的手段,其中就包括了 Cookie...
2018-04-10 17:11:00 227
原创 python模拟登陆豆瓣
登陆豆瓣 登陆豆瓣 requests模块登陆豆瓣 urllib2模块登陆豆瓣 requests模块登陆豆瓣 前提: 使用pip命令安装requests和BeautifulSoup4 思路: 1.访问登陆界面,使用google自带的开发工具分析出需要post的代码 2.把验证码下载下来,进行手动输入 3.访问登陆之后的页面,测试是否成功 # -*...
2018-04-09 21:50:51 503
原创 学习JDBC
JDBC技术 JDBC技术 简介 jdbc的API jdbc操作步骤 Statement和PreparedStatement JDBC批处理 JDBC处理大容量数据 JDBC如何获取自增长的值 JDBC的事务 简介 使用java程序访问(操作)数据库(发送sql语句),这叫用到了jdbc技术.jdbc就是Sun公司设计的一套java程序连接(操作)具体的数据库产品的接...
2018-04-08 16:45:22 631
原创 python:xml爬取百度贴吧图片
使用xml爬取百度贴吧的图片 # -*- coding:utf-8 -*- import urllib2 import urllib from lxml import etree import os #定义贴吧爬虫类 class TiebaSpider: #爬虫的调度器 def tiebaSpider(self , url , beginPage , endPage): ...
2018-04-07 21:31:42 292
原创 学习会话管理
会话管理 会话管理 概念 会话管理技术 Cookie技术原理 Cookie细节 Session引入 Session使用步骤 Session原理 Session细节 概念 管理浏览器与服务器之间的会话过程中产生的会话数据 经过分析,数据共享可以使用域对象,因为ServletContext只有一个,导致每次向里面放数据的时候,如果键相同,值就会覆盖所以不可行.而re...
2018-04-04 17:24:09 304 1
原创 Servlet学习
servlet servlet 概念 servlet执行的过程 缺省路径 servlet生命周期 tomcat服务器调用这四个方法 servlet并发问题 servlet自动加载机制 ServletConfig对象 ServletContext对象 介绍 获取ServletContext对象 ServletContext的五大作用 总结 概念 1.servlet是一个...
2018-03-29 16:39:25 431
java如何实现文本转语音(TTS)
2017-12-11
TA创建的收藏夹 TA关注的收藏夹
TA关注的人