- 博客(11)
- 资源 (1)
- 问答 (1)
- 收藏
- 关注
原创 python:多线程爬取糗事百科
多线程爬取糗事百科多线程爬取糗事百科# -*- coding:utf-8 -*-#使用了线程库import threading#请求处理import requests#队列from Queue import Queue#解析库from lxml import etree#json处理import jsonimport time#标志位...
2018-04-12 22:30:34 600 1
原创 爬虫总结(二)
爬虫总结爬虫总结正则表达式Xpathlxml库CSS选择器:BeautifulSoup4JSON正则表达式1.Python的re模块 在Python中,我们可以使用内置的re模块来使用正则表达式.注意:正则表达式使用对特殊字符进行转义,所以如果我们要使用原始字符串,只需要加一个r前缀,示例:r'hello\tworld'2.re模块的一般使用...
2018-04-12 21:31:24 327
原创 学习过滤器
过滤器过滤器引入什么是过滤器过滤器的生命周期在web.xml文件中配置过滤器FilterConfig对象FilterChain对象引入 在servlet中获取用户参数数据 : request.getParameter(“参数名”) 遇到参数内容中文乱码问题 post提交: request.setCharacterEncoding(“utf-...
2018-04-11 16:22:57 220
原创 学习IO流
IO流IO流使用FileWriter复制文件使用缓冲区,提高效率使用java内置的高效字节流完成文件复制使用LineNumberReader打印行数练习:文件深度遍历练习:删除一个带内容的目录练习:程序计数器练习:获取指定目录下,指定扩展名的文件练习:文件切割器练习:碎片文件合并使用FileWriter复制文件public static void...
2018-04-11 11:23:12 254
原创 爬虫总结(一)
爬虫总结(一)爬虫总结(一)urllib2模块urllib2直接访问urlurllib2构造header来反爬虫自定义handler构造具有代理功能的opener自定义handler构造具有保存cookie功能的openerRequests模块Requests引入Request访问urlurllib2模块urllib2直接访问urlres...
2018-04-10 22:10:36 566
原创 Cookie,Session,Token
1.什么是CookieSessionToken1.什么是CookieCookie 技术产生源于 HTTP 协议在互联网上的急速发展。随着互联网时代的策马奔腾,带宽等限制不存在了,人们需要更复杂的互联网交互活动,就必须同服务器保持活动状态(简称:保活)。于是,在浏览器发展初期,为了适应用户的需求技术上推出了各种保持 Web 浏览状态的手段,其中就包括了 Cookie...
2018-04-10 17:11:00 232
原创 python模拟登陆豆瓣
登陆豆瓣登陆豆瓣requests模块登陆豆瓣urllib2模块登陆豆瓣requests模块登陆豆瓣前提: 使用pip命令安装requests和BeautifulSoup4 思路: 1.访问登陆界面,使用google自带的开发工具分析出需要post的代码 2.把验证码下载下来,进行手动输入 3.访问登陆之后的页面,测试是否成功# -*...
2018-04-09 21:50:51 507
原创 学习JDBC
JDBC技术JDBC技术简介jdbc的APIjdbc操作步骤Statement和PreparedStatementJDBC批处理JDBC处理大容量数据JDBC如何获取自增长的值JDBC的事务简介 使用java程序访问(操作)数据库(发送sql语句),这叫用到了jdbc技术.jdbc就是Sun公司设计的一套java程序连接(操作)具体的数据库产品的接...
2018-04-08 16:45:22 636
原创 python:xml爬取百度贴吧图片
使用xml爬取百度贴吧的图片# -*- coding:utf-8 -*-import urllib2import urllibfrom lxml import etreeimport os#定义贴吧爬虫类class TiebaSpider: #爬虫的调度器 def tiebaSpider(self , url , beginPage , endPage):...
2018-04-07 21:31:42 295
原创 学习会话管理
会话管理会话管理概念会话管理技术Cookie技术原理Cookie细节Session引入Session使用步骤Session原理Session细节概念 管理浏览器与服务器之间的会话过程中产生的会话数据 经过分析,数据共享可以使用域对象,因为ServletContext只有一个,导致每次向里面放数据的时候,如果键相同,值就会覆盖所以不可行.而re...
2018-04-04 17:24:09 310 1
原创 Servlet学习
servletservlet概念servlet执行的过程缺省路径servlet生命周期tomcat服务器调用这四个方法servlet并发问题servlet自动加载机制ServletConfig对象ServletContext对象介绍获取ServletContext对象ServletContext的五大作用总结概念1.servlet是一个...
2018-03-29 16:39:25 438
java如何实现文本转语音(TTS)
2017-12-11
TA创建的收藏夹 TA关注的收藏夹
TA关注的人