python
文章平均质量分 53
tianxingzheaa
这个作者很懒,什么都没留下…
展开
-
除去pdf文件内部的超链接/a标签
pdf格式是一个比较固定的,正常状态下是不能编辑的格式,主要用来传递信息和展示,但项目中或迟或早的肯定会遇到需要修改pdf内容的需求,目前遇到的就有:pdf2html, pdf2png, pdf内部去链接, pdf加水印, 修改删除pdf文档内容(去水印)…… 目前, 所有需求都已经实现, 具体如下: pdf2png: 用imagemagick可以实现, 不赘述; pdf2htm原创 2015-12-16 20:14:51 · 259554 阅读 · 0 评论 -
Python 脚本运行时Segmentation fault (core dumped)
问题如题描述,python 运行过程中直接导致python 解释器崩溃(不是异常,直接崩溃),下面简叙一下debug过程:google查询结果显示这种情况多数是因为Python里的C扩展导致(访问了非法内存区域,可能和C自身内存管理机制有关),而且可以用gdb进行debug(因为Python崩溃,没法用python自身的debug机制,定位到出错的位置),gdb就输出一个出错的内存地址,楼主没想深原创 2017-02-25 10:23:15 · 269335 阅读 · 10 评论 -
selenium+phantomJS爬虫,适用于登陆限制强,点触验证码等一些场景
selenium是很出名的自动化测试工具,多数场景是测试工程师用来做自动化测试,但是同样selenium可以作为基本上模拟浏览器的工具,去爬取一些基于http request不能或者很复杂的才能爬取的站点,而且交互式脚本(如:python) + selenium可以直接看到浏览器的执行过程,利于debug,同时看上去比较有成就感。贴个实例吧firefoxProfile = FirefoxProfil原创 2016-03-27 19:02:04 · 264193 阅读 · 1 评论 -
python安装MySQLdb模块-(ubuntu,windows)
python没有自带mysql的模块,需要自己安装ubuntu:sudo apt-get安装:直接运行sudo apt-get install python-mysqldbWindows: 上某全家桶网站,下载MySQL-python的exe文件手动安装PS:两种系统上,pip安装都会报错(搞不懂):pip install mysql-python“Command python setup.p原创 2016-03-25 10:18:03 · 258755 阅读 · 1 评论 -
Django + Apache + wsgi配置和环境搭建(ubuntu)
上一篇写了Django + nginx + uwsgi配置和环境搭建(ubuntu) 因为公司服务器环境问题,又配置了apache的环境,记录如下:一. 安装环境:#apachesudo apt-get install apache2# Python 2sudo apt-get install libapache2-mod-wsgi二. django: 2.1 保证网站能运行: 根目录原创 2016-03-30 20:08:56 · 249938 阅读 · 0 评论 -
Django + nginx + uwsgi配置和环境搭建(ubuntu)
Django的部署可以有很多方式,采用nginx+uwsgi的方式是其中比较常见的一种方式。 在这种方式中,我们的通常做法是,将nginx作为服务器最前端,它将接收WEB的所有请求,统一管理请求。nginx把所有静态请求自己来处理(这是NGINX的强项)。然后,NGINX将所有非静态请求通过uwsgi传递给Django,由Django来进行处理,从而完成一次WEB请求。uwsgi官网:http:/原创 2016-03-30 10:49:32 · 254467 阅读 · 0 评论 -
python PIL 处理图片的模快 Image类
python图形处理库PIL(Python Image Library) , 使用时, 我们应该首选去官网看文档,如果需求比较简单,可以看看别人的blog,毕竟中文的比较容易上手。 我使用的功能比较简单: resize Image, 尺寸减半;尽量压缩大小 Image.open()一个图片以后,就可以进行你想要的操作Import Imageim = Image.open(file_path)原创 2015-12-08 19:03:49 · 257759 阅读 · 0 评论 -
pdf加水印,文字和图片,超链接, java itext, 这里有你想要的一切
最近公司网站的pdf需要加上我们自己的水印,多番review打水印加链接的方法, windows上的A-PDF可以满足需求, 之前网站组也是用这种方法做的, 但是效率较低, 因为公司的pdf的其他处理逻辑我们都部署到了分布式的linux系统上,为了一致性和提高效率,多番谷歌和度娘–(发现多数blog只是实现了在pdf里打上文字水印的功能, 而且大同小异, 一看就是相互抄袭), 偶然发现了java的i原创 2015-12-08 20:10:59 · 261372 阅读 · 0 评论 -
字符编码笔记:ASCII,Unicode 和 UTF-8
原文地址:http://www.ruanyifeng.com/blog/2007/10/ascii_unicode_and_utf-8.html 一、ASCII 码 我们知道,计算机内部,所有信息最终都是一个二进制值。每一个二进制位(bit)有0和1两种状态,因此八个二进制位就可以组合出256种状态,这被称为一个字节(byte)。也就是说,一个字节一共可以用来表示256种不同的状态,每一个状态...转载 2018-07-03 11:09:54 · 2150 阅读 · 0 评论