python
文章平均质量分 50
linzch3
这个作者很懒,什么都没留下…
展开
-
python 安装easy_install和pip
今天发现python2.7是没有自带pip的,我之前安装的python3.5就有。Anyway,顺手装一波。去网上查了教程,发现这篇文章讲得很清楚,不过我想补充一下。第一点:在cmd上输入 python ez_setup.py 之前,要自行cd到 ez_setup.py 的所在路径。第二点:下载pip时,是选择 Source 类型文件,里面才有setup.py。原创 2016-07-23 17:59:51 · 467 阅读 · 0 评论 -
关于BeautifulSoup的总结
最近一直在用BeautifulSoup,但是语法很容易忘记。在这里做个学习总结吧。参考:Beautiful Soup 4.2.0 文档功能BeautifulSoup是用来从HTML或XML中提取数据的Python库。导入使用方法: from bs4 import BeautifulSoup soup = BeautifulSoup(html)编码soup使用Unicode编码。对象种类有四种类型转载 2017-03-09 17:56:37 · 2212 阅读 · 0 评论 -
100 numpy exercises
本文翻译自:这里,并会添加笔(译)者的一些适当的注解。1.导入numpy,并重命名为np(★☆☆)import numpy as np2.输出numpy的版本和配置(★☆☆)print(np.__version__)np.show_config()3.创建大小为10的空向量(★☆☆)Z = np.zeros(10)print(Z)4.如何查找数组的内存大小(★☆☆)Z = np.zeros((1翻译 2017-03-03 16:27:38 · 7622 阅读 · 0 评论 -
python人脸识别
代码Talk is cheap, show you the code! 代码参考自:这里无注释版:import cv2faceClassifier=cv2.CascadeClassifier('haarcascade_frontalface_default.xml')objImage=cv2.imread('test2.jpg')cvtImage=cv2.cvtColor(objImage,原创 2017-03-20 17:35:38 · 2275 阅读 · 0 评论 -
python爬虫实战 | 批量爬取开放服务器的文件
今天在查有关spss modeler的参考资料时,发现了这个网站: ftp://public.dhe.ibm.com/software/analytics/spss/documentation/modeler/14.2/zh_CN/里面包含了许多有关spss modeler的文件,于是想用爬虫把它们都爬取下来。 文件不多,但是想到以后可能会遇到文件比较多的情况,到时候再根据这个程序拓展一下便可以原创 2017-04-01 23:18:26 · 5255 阅读 · 2 评论 -
python 验证码识别
Talk is cheap, show you the Code!import numpy as npimport matplotlib.pyplot as pltfrom sklearn.cluster import KMeansfrom PIL import Image#打开图像im=np.array(Image.open('yzm.png'))#得到图像3个维度h,w,san=im.原创 2017-03-26 11:24:39 · 754 阅读 · 0 评论 -
python获得Python脚本所在目录的位置的 【坑】
坑:用os.getcwd()不一定能获得脚本所在的目录一般地,如果是要获得脚本运行的当前目录所在位置,那么可以使用os模块的os.getcwd()函数。但是如果我们想找到脚本所在目录的位置,这种方法就会出问题,举例:若在C:\test目录下执行python getpath\getpath.py,那么os.getcwd()只会输出“C:\test”。这便是获得脚本运行的当前目录所在位置的含义。正确做法原创 2017-05-06 12:20:05 · 5191 阅读 · 0 评论 -
jieba的简单使用
本文涉及jieba.cut、jieba.addword、jieba.load_userdict这3个函数运行环境:IPythonimport jieba;for w in jieba.cut("我爱Python"): print(w)输出:Building prefix dict from the default dictionary ...Loading model from cach原创 2017-05-06 13:07:57 · 13742 阅读 · 1 评论 -
python爬虫——爬取用js实现翻页的网站
——————————————-背景介绍——————————————— 首先,这次想爬取的网站地址为:http://www.zhuhai.gov.cn/hd/zxts_44606/tsfk/查看网站的源代码后,发现页面数据没有在源代码中,猜测应是js生成的。检查元素后,刷新Network,可找到表格数据所在的URL:https://www.zh12345.gov.cn/external/zf/get原创 2017-06-06 16:31:28 · 32728 阅读 · 6 评论 -
kmeans总结
注:本文所有代码均可在笔者的github中找到。关于分类和聚类kmeans属于聚类算法中的一种。分类和聚类是不同的概念。虽然两者的目的都是对数据进行分类,但是却有一定的区别。分类是按照某种标准给对象贴标签,再根据标签来区分归类;聚类是事先没有给出标签,刚开始并不知道如何对数据分类,完全是算法自己来判断各条数据之间的相似性,相似的就放在一起。在聚类的结论出来之前,不能知道每一类有什么特点,最后一原创 2017-02-26 19:40:11 · 11077 阅读 · 0 评论 -
python 语法糖【不断更新】
1.得到a和b两个数的最大值solution: c = [b,a][a>b] 测试:>>> a=1>>> b=2>>> c=[b,a][a>b]>>> c22.假设现在给定了一个list:a = [[1, 2], [3, 4, 5], [6, 7], [8], [9]]问如何将其转化成:[1, 2, 3, 4, 5, 6, 7, 8, 9]其实就是将所有数据都拿出来组成一个1*n的list原创 2017-03-26 14:12:25 · 2957 阅读 · 0 评论 -
python代码转matlab代码的注意点【不断更新...】
笔者在将python代码转成matlab代码的时候,遇到有许多问题,为了方便日后快速查询,便在此处记录了下来。 python matlab 代码描述 row,col=shape(dataSet) [row, col] = size(dataSet) 得到数据集dataSet的行数和列数原创 2017-03-02 18:55:16 · 14206 阅读 · 2 评论 -
UnicodeDecodeError: 'ascii' codec can't decode byte 0xc1 in position 7: ordinal not in range(128)
正准备用python的openpyxl包把爬虫的数据存到excel表格中,在cmd上用pip安装openpyxl包时出现了如下错误:...UnicodeDecodeError: 'ascii' codec can't decode byte 0xc1 in position 7: ordinal not in range(128)查了许多资料,都不行。最后发现原因竟然又是自己windows上的用户原创 2016-07-23 19:34:11 · 1523 阅读 · 0 评论 -
Python入门&进阶资料整合
一、对于没有编程基础的朋友,可以选择下面的教程:Crossin的编程教室论坛Crossin老师也有微信版的教程,可以在手机上学习:Crossin的编程教室WeChat版本公众号:crossincode二、对于有编程基础的朋友,则可以选择:廖雪峰的Python教程前面两个我都学习过,觉得两个老师讲得都不错三、其他前辈已经整理好的python资源:1.PY大法好|Python优质资料合集2.学好Pyth原创 2016-07-23 20:07:42 · 2681 阅读 · 1 评论 -
安装pygame for Python3.5
首先进入pygame官网下载页面:http://www.pygame.org/download.shtml 页面上提供的有py2.4-py2.7,py3.1-py3.2的版本(py2.4就是对应python2.4版本)。由于我安装的是python3.5.0,要进入这个页面: http://www.lfd.uci.edu/~gohlke/pythonlibs/#pygame 打开之后,看到的界原创 2016-07-18 15:07:52 · 13867 阅读 · 2 评论 -
os模块学习
os模块是被使用很频繁的一个模块,今天趁着有时间,总结一下一些常用的函数。Python 模块学习:os模块这篇文章写得不错,我就不造轮子了,下面给出我自己的一些补充。另外还有一个简化版本python os.path模块,其中介绍的函数也更多了,可以了解一下。1.os.getcwd() 的名字好像有点难记?其实cwd就是current working directory,当前工作目录的意思2.os.l原创 2016-09-01 18:27:15 · 449 阅读 · 0 评论 -
字符串常用操作方法总结
# -*- coding:utf-8 -*-'''字符串常用操作方法总结,部分内容整理自网上'''test_str='The Zen of Python, by Tim Peters''''一些简单实用的判断函数:isalnum() #是否全是字母和数字,并至少有一个字符isalpha() #是否全是字母,并至少有一个字符isdigit() #是否全是数字,并至少有一个字符issp原创 2016-09-03 15:41:04 · 3018 阅读 · 0 评论 -
numpy.random.seed()的使用
这个函数的使用方法,在这里已经有前辈讲解过了,只是自己在测试的时候有一些思考,所以便写了这篇博客。下面是前辈文章的原话: seed( ) 用于指定随机数生成时所用算法开始的整数值,如果使用相同的seed( )值,则每次生成的随即数都相同,如果不设置这个值,则系统根据时间来自己选择这个值,此时每次生成的随机数因时间差异而不同。编写如下第一份代码:from numpy import *num=0原创 2017-02-27 19:52:29 · 190319 阅读 · 36 评论 -
numpy使用技巧之数组过滤
当使用布尔数组b作为下标存取数组x中的元素时,将收集数组x中所有在数组b中对应下标为True的元素。使用布尔数组作为下标获得的数组不和原始数组共享数据空间,注意这种方式只对应于布尔数组(array),不能使用布尔列表(list)。 参考自:这里>>> x = np.arange(5,0,-1)>>> xarray([5, 4, 3, 2, 1])>>> x[np.array([True原创 2017-02-28 08:40:35 · 15667 阅读 · 0 评论 -
python绘图资料整合【更新中...】
1.基础入门 1.1matplotlib.pyplot的基础介绍 2.1【数字的可视化:python画图之散点图sactter函数详解】原创 2017-02-28 16:04:05 · 393 阅读 · 0 评论 -
理解Python中的with…as…语法
原文 使用语言的好特性,而不是那些糟糕的特性————不知道谁说的好久不学习python的语法了,上次去面试,和面试官聊到了python中的with-as statement(也称context manager),挺感兴趣的,这两天学习了一番,收获颇丰在此分享。先说明一个常见问题,文件打开:try: f = open('xxx') do somethingexcept: d转载 2017-03-08 10:26:05 · 477 阅读 · 0 评论 -
python爬虫实战-自动IP地址查询
该段代码实现IP地址的自动查询。 IP地址查询结果的来源:http://www.ip138.com/ips138.asp假设查询IP地址为:172.18.92.222,在上面那个网站的查询结果如下: 观察发现查询结果在其中一对tr标签的li标签中。对应的源代码为: Python实现:# -*- coding:utf-8 -*-import requestsfrom bs4 import原创 2017-03-15 23:39:58 · 5154 阅读 · 0 评论 -
python获取环境变量
import osenv = os.environ['PATH'].split(';')#划分为listenv = [i for i in env if i !=""]#去除空值env.sort(key = lambda x: x[0])#按照盘符排序#....输出原创 2017-09-18 14:51:04 · 2707 阅读 · 0 评论