自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

qq_31258245的博客

永远做自己感兴趣的事

  • 博客(18)
  • 资源 (3)
  • 问答 (3)
  • 收藏
  • 关注

原创 记Oracle实验笔记

使用Oracle开发一个JavaEE银行管理系统创建表时候可以使用分区,有范围分区,哈希分区,列表分区,复合分区 参考链接http://blog.csdn.net/oyzl68/article/details/8142617约束添加、删除、启动、禁用 参考链接http://blog.csdn.net/a154832918/article/details/7087350普通用户创建序

2017-12-29 16:53:56 163

原创 Phantomjs和selenium部署在centos服务器上出错及解决方法

在Linux系统上写的一个爬虫程序用到了selenium的webdriver和phantomjs,运行没有问题。但是当部署在centos服务器上时却出现了错误。 错误信息如下selenium.common.exceptions.WebDriverException: Message: Service ./phantomjs-2.1.1-linux-x86_64/bin/phantomjs unex

2017-12-28 02:29:41 2337

原创 Python实现Restful API

Python实现Restful API最近写了一个网络验证登录的爬虫,需要发布为Rest服务,然后发现Flask是一个很好的Web框架,使用Python语言实现。1. 安装flaskpip install flask2.编写简单的HelloWorldfrom flask import Flaskapp = Flask(__name__)@app.route('/')def index():

2017-12-27 21:13:27 12227

原创 Linux下源码安装Python

Linux下源码安装Python在官网下载对应版本的Pythonhttps://www.python.org/downloads/,选择下方的gzp文件 2.解压,配置安装目录tar -zxvf Python-3.5.2.tgzcd Python-3.5.2./configure --prefix=/usr/python3.编译,安装makemake install这个过程10-20

2017-12-27 21:05:21 368

原创 JavaScrip实现前端列表分页

在一些网站的管理系统中,通常的查询功能会有很多信息,这时候前端如果不分页显示,那么浏览器的长度就会很长。所以通常要进行分页处理。     对于分页主要有两种方法,第一种方法有后台来进行分页,前端通过请求后台传入分页所需的参数来使后台返回响应的分页结果。第二种方法是有前台来进行分页,后台一次性返回全部结果,前端对这些结果进行分页显示处理。     下面主要是实现的一个前端分页的效果,先上几张效果图

2017-12-25 12:27:19 25188 8

原创 Linux安装Mysql及其使用

Linux下安装mysql安装环境centos 64位1.下载官网下载 mysql-5.6.38-linux-glibc2.12-x86_64.tar.gz2.解压# 解压tar -xzvf mysql-5.6.38-linux-glibc2.12-x86_64.tar.gz# 解压后移动到安装目录mv mysql-5.6.38-linux-glibc2.12-x86_64 /usr/loc

2017-12-25 10:56:55 180

原创 一些常用的pip命令总结

pip常用命令总结 pip install [package] 安装库 pip show [package] 显示包的详细信息 pip list 显示在虚拟环境中的库 pip freeze > requirements.txt 输出使用pip install 安装的库 pip install -r requirements.txt 安装requirements

2017-12-11 11:55:15 272

原创 Python虚拟环境virtualenv保存库文件

我们在使用Python做项目时,可能同时负责多个项目,或者想要打包某个项目及其关联的库文件时,会担心库之间有冲突,那么我们可以安装一个Python虚拟环境virtualenv。 当一个Python库不用虚拟环境安装时,实际上是在全局安装它。 1.安装虚拟环境工具virtualenvpip install virtualenv(可能需要管理员权限)2.创建虚拟环境virtualenv qzone3

2017-12-11 11:07:50 688

原创 UE4踩坑总结

右键后弹出的面板上方禁用(情景关联即可)context sensitive

2017-12-10 17:50:09 1051 1

原创 Python爬虫之从网站图片中抓取文字

本程序采用selenium和phantomjs爬取亚马逊图书详情页面,并且使用Tesseract OCR识别图书大图上的文字。   程序模拟了我们在浏览器上的操作过程。点击下方会触发页面的js弹出模态框,此时页面的dom会增加,然后点击模态框右边的图片可以进行切换,模态框上左边的图片会跟着进行变换。通过获取模态框左边的图片然后用OCR技术识别图片上的文字。 实现代码如下:import time

2017-12-08 15:55:23 6759 1

原创 教务系统抢课程序的思路

最近在学习Python爬虫处理表单登录的知识,就想到了拿学校的教务系统来试手。经过调查发现学校的教务系统登录有如下特点:有两个登录页面,一个页面是需要输入账号密码以及四位字符验证码,另一个页面只需要账号密码不需要验证码。两个登录页面表单提交的地址不一样,但是都需要encoded字段,然而encoded是经过js加密处理得到的复杂字符串。需要验证码的那个登录页面是当你提交表单的时候会先向服务器发

2017-12-08 13:54:03 18019

原创 Python爬虫之处理带Ajax、Js的网页

Python爬虫之处理带Ajax、Js的网页  现在很多网站的都大量使用JavaScript,或者使用了Ajax技术。这样在网页加载完成后,url虽然不改变但是网页的DOM元素内容却可以动态的变化。如果处理这种网页是还用requests库或者python自带的urllib库那么得到的网页内容和网页在浏览器中显示的内容是不一致的。那么我们这样就采集不到想要的结果。   为了解决这个问题,可以使用Se

2017-12-08 13:28:50 15664

原创 Python爬虫之表单和登录窗口采集

Python自带的urllib库实现了HTTP基本的GET功能,当我们想要实现比GET更多的事情时,那么就需要去寻找支持Python标准的第三方库了。   Requests库可以成为你的选择,它可以处理复杂的HTTP请求,cookie,header等内容,是一个第三方库。   可以使用Python包管理器,执行命令pip install requests安装Requests库。   浏览器的地

2017-12-08 13:04:13 5304 1

原创 Python实现文章自动生成

Python实现文章自动生成  下面的Python程序实现了通过从网页抓取一篇文章,然后根据这篇文章来生成新的文章,这其中的原理就是基于概率统计的文本分析。   过程大概就是网页抓取数据->统计分析->生成新文章。网页抓取数据是通过BeautifulSoup库来抓取网页上的文本内容。统计分析这个首先需要使用ngram模型来把文章进行分词并统计频率。因为文章生成主要依据马尔可夫模型,所以使用了2-g

2017-12-07 17:42:31 29576 11

原创 Python爬取特朗普就职演讲稿,使用ngram模型进行数据清洗

利用Python爬取特朗普英文就职演讲稿,并使用ngram模型进行数据清洗处理  互联网络上数据十分丰富,我们可以利用网络爬虫技术轻松获取到这些数据,但是获取的数据往往不像我们学习爬虫时那样样式规范的数据。在网络数据采集中,不可避免地会遇到样式不规范的数据,而且无法对数据集进行挑剔,所以掌握数据清洗的方法十分必要。   本文主要内容是利用Python从网页上爬取格式混乱的英文讲稿,然后将数据进行清

2017-12-05 13:52:52 1911 1

原创 Python连接mysql数据库

Python连接mysql数据库  在使用python写爬虫做网络数据采集项目时常常使用Mysql数据库来存储数据,因为Mysql受众广泛,免费,开箱即用的特点。   要在Python中使用Mysql数据库,前提条件当然是先安装Mysql,Mysql具体的安装方法这里不多描述,可查看相关博客。   要进行Python和Mysql的整合,像Java那样需要借用JDBC连接桥。Python没有内置的

2017-12-03 23:33:57 438

原创 Python存储csv文件

Python存储csv文件CSV(Comma-Separated Values),逗号分隔值,是存储表格数据的常用文件格式。其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。 Python提供有cs

2017-12-02 10:23:24 4660

原创 Python爬虫之下载媒体文件

Python爬虫之下载媒体文件在网络上存储媒体文件有两种方式:存储媒体文件的URL链接,把媒体文件下载到主机。 对于存储URL这种方式,既有优点也有缺点。优点:爬虫运行的很快,耗费流量少。 节省存储空间。 降低服务器主机负载。 代码编写更简单。缺点:内嵌在你网站或应用中的外站的URL链接是盗链,如果外站加了防盗链措施,那么就会引来麻烦。 如果链接的内容被改变后,你使用的链接很可能出乎意料的

2017-12-02 10:08:24 1146

操作系统进程调度,内存分配算法GUI实现

JavaFX实现了操作系统进程调度算法和内存管理算法,GUI实现。下载积分设置的 3 积分,被 CSDN 自动修改成了 37 积分。。。。。。。。。。。。。。

2016-12-17

算法实验源代码

算法实验源代码,贪心,动态规划,回溯,分治实现0-1背包、多机调度、最长上升子序列、最短路径等问题

2016-12-17

c++程序设计(机械工业出版社)课后习题代码

c++(机械工业出版社)课后习题代码,很全的哦,最新版本!

2015-12-04

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除