python
文章平均质量分 76
南宫伊枫
搞IT的人们伤不起
展开
-
python实现简单爬虫功能
在我们日常上网浏览网页的时候,经常会看到一些好看的图片,我们就希望把这些图片保存下载,或者用户用来做桌面壁纸,或者用来做设计的素材。 我们最常规的做法就是通过鼠标右键,选择另存为。但有些图片鼠标右键的时候并没有另存为选项,还有办法就通过就是通过截图工具截取下来,但这样就降低图片的清晰度。好吧~!其实你很厉害的,右键查看页面源代码。 我们可以通过python 来实现这样一个简单的原创 2015-10-18 01:48:38 · 457 阅读 · 0 评论 -
Python 使用 pip 升级所有包
pip 当前内建命令并不支持升级所有已安装的Python模块。列出当前安装的包:pip list列出可升级的包:pip list --outdate升级一个包:pip install --upgrade requests // mac,linux,unix 在命令前加 sudo -H升级所有可升级的包:$ pip freeze --local | grep -v '^-e' | cut -d =...转载 2018-07-15 15:47:04 · 5037 阅读 · 1 评论 -
python 文本聚类
在本教程中,我会利用 Python 来说明怎样聚类一系列的文档。我所演示的实例会识别出 top 100 电影的(来自 IMDB 列表)剧情简介的隐藏结构。关于这个例子的详细讨论在初始版本里。本教程包括:对所有剧情简介分词(tokenizing)和词干化(stemming)利用 tf-idf 将语料库转换为向量空间(vector space)计算每个文档间的余弦距离(cosine dista转载 2017-10-23 21:34:56 · 7454 阅读 · 1 评论 -
Python ElasticSearch API
描述:ElasticSearch是一个基于Lucene的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于RESTful web接口。下面介绍了利用Python API接口进行数据查询,方便其他系统的调用。 安装API1pip install elasticsearch原创 2017-08-22 10:31:19 · 9696 阅读 · 1 评论 -
pyinstaller的库导入和多进程打包问题
以前使用py2exe进行打包,那也仅限于windows。后来由于工作原因需要在Linux上进行打包操作,那么就不能使用py2exe工具了,后来选择了pyinstaller。在实际应用中,pyinstaller打包的效率和操作性很好,个人觉得比py2exe更加智能,但是也是有一些问题。开发环境:Windows 7 + python3.4一、import导入的问原创 2017-07-20 15:51:01 · 965 阅读 · 0 评论 -
Python 结巴分词 关键词抽取分析
1 简介关键词抽取就是从文本里面把跟这篇文档意义最相关的一些词抽取出来。这个可以追溯到文献检索初期,当时还不支持全文搜索的时候,关键词就可以作为搜索这篇论文的词语。因此,目前依然可以在论文中看到关键词这一项。除了这些,关键词还可以在文本聚类、分类、自动摘要等领域中有着重要的作用。比如在聚类时将关键词相似的几篇文档看成一个团簇,可以大大提高聚类算法的收敛速度;从某天所有的新闻中提取出原创 2017-03-28 14:36:15 · 17355 阅读 · 5 评论 -
python post/get 请求
urllibGETf=urllib.urlopen("http://m.cnblogs.com/")s=f.read()print s带参数params = urllib.urlencode({'id': 8, 'name': 'jack', 'age': 25})f = urllib.urlopen("http://localhost:18797/MailCli原创 2016-11-14 17:58:50 · 285 阅读 · 0 评论 -
python 将数据库导入mysql
#!/usr/bin/python#coding=utf-8import MySQLdbimport leancloudimport sysleancloud.init('7GfUliPOBfzUBqcufluOrAjT', 'cMK8E9N6NvweDvhuigbMxM0o')conn=MySQLdb.connect(host="localhost",user="root",pa原创 2016-10-17 22:54:12 · 590 阅读 · 0 评论 -
Python多线程学习
一、Python中的线程使用: Python中使用线程有两种方式:函数或者用类来包装线程对象。1、 函数式:调用thread模块中的start_new_thread()函数来产生新线程。如下例: import time import thread def timer(no, interval): cnt = 0 while cnt10:原创 2016-10-10 09:52:19 · 291 阅读 · 0 评论 -
python 处理命令行参数
转自:http://blog.csdn.net/byrsongqq/article/details/5623357本篇将介绍Python中sys, getopt模块处理命令行参数如果想对python脚本传参数,python中对应的argc, argv(c语言的命令行参数)是什么呢?需要模块:sys参数个数:len(sys.argv)脚本名: sys.argv[转载 2016-04-20 18:49:58 · 297 阅读 · 0 评论 -
python 模拟登录
本文主要用python实现了对网站的模拟登录。通过自己构造post数据来用Python实现登录过程。当你要模拟登录一个网站时,首先要搞清楚网站的登录处理细节(发了什么样的数据,给谁发等...)。我是通过HTTPfox来抓取http数据包来分析该网站的登录流程。同时,我们还要分析抓到的post包的数据结构和header,要根据提交的数据结构和heander来构造自己的post数据原创 2016-04-11 20:20:02 · 360 阅读 · 0 评论 -
C++调用Python浅析
C++调用Python浅析 环境VS2005Python2.5.4 Windows XP SP3 简述一般开发过游戏的都知道Lua和C++可以很好的结合在一起,取长补短,把Lua脚本当成类似动态链接库来使用,很好的利用了脚本开发的灵活性。而作为一门流行的通用型脚本语言Python,也是可以做到的。在一个C++应用程序中,我们可以用一组插件来实现一些具有统一接口的转载 2016-04-11 12:18:25 · 377 阅读 · 0 评论 -
java 调用python
转载自:http://blog.sina.com.cn/s/blog_64e467d60100uhls.htmlhttp://sourceforge.net/projects/jython/下载jython包,把其中的jython.jar添加到工程目录1.在java类中直接执行python语句view plainimport java转载 2016-04-13 09:06:08 · 310 阅读 · 0 评论 -
Python 基础语法(一)
Python的特点 1. 简单 Python是一种代表简单思想的语言。 2. 易学 Python有极其简单的语法。 3. 免费、开源 Python是FLOSS(自由/开放源码软件)之一。 4. 高层语言 使用Python编写程序时无需考虑如何管理程序使用的内存一类的底层细节。 5. 可移植性 Python已被移植到原创 2015-10-15 15:50:23 · 426 阅读 · 0 评论 -
selenium设置chrome和phantomjs的请求头信息
出于反爬虫也好-跳转到手机端页面也好都需要设置请求头,那么如何进行呢? 目录一:selenium设置phantomjs请求头: 二:selenium设置chrome请求头: 三:selenium设置chrome–cookie: 四:selenium设置phantomjs-图片不加载: 一:selenium设置phantomjs请求头:可以复制下列代码运行,会访问http...转载 2018-11-29 12:44:26 · 368 阅读 · 0 评论