Python基础
文章平均质量分 86
哈士奇说喵
我的目标是星辰大海啊~
展开
-
txt转化csv的接口(子函数)
Python 2.7 IDE Pycharm 5.0.3 pyExcelerator 0.6.4.1目的 将txt转化为csv格式准备工作安装pyExcelerator包推荐使用pip install pyExcelerator或者百度pyExcelerator github下载zip解压后,cmd切换到解压目录,执行输入python setup.py install,还不明白就百度把原创 2016-10-28 10:34:16 · 1105 阅读 · 0 评论 -
随机采样接口(子函数)
Python 2.7 IDE Pycharm 5.0.3 sklearn 0.17.目前接口库@MrLevo520–数据转化接口仍在不断更新目的 将一堆数据中随机或者按比例抽取部分作为训练样本并保存txt/csv准备工作 请先安装相关科学计数包,numpy,sklearn等,具体看包导入情况进行相应安装接口代码1-按数量随机抽样首先新建一个py文件,我以demo.py为例这个名字随便原创 2016-10-31 22:06:20 · 946 阅读 · 0 评论 -
解决网页元素无法定位(NoSuchElementException: Unable to locate element)的几种方法
Python 2.7 IDE Pycharm 5.0.3姊妹篇请见解决Selenium弹出新页面无法定位元素问题(Unable to locate element) 只解决一个问题--NoSuchElementException: Message: Unable to locate element出错形式出错原因1.可能元素加载未完成元素加载没完成,同样的路径定位,每次测试结果确是不一样的,原创 2016-07-19 11:21:53 · 100812 阅读 · 7 评论 -
Python小白带小白初涉多进程
Python 2.7 IDE Pycharm 5.0.3对于操作系统来说,一个任务就是一个进程(Process),比如打开一个浏览器就是启动一个浏览器进程,打开一个记事本就启动了一个记事本进程,打开两个记事本就启动了两个记事本进程,打开一个Word就启动了一个Word进程。有些进程还不止同时干一件事,比如Word,它可以同时进行打字、拼写检查、打印等事情。在一个进程内部,要同时干多件事,就需要同时原创 2016-06-21 16:04:23 · 1871 阅读 · 1 评论 -
混淆矩阵可视化接口(子函数)
Pyhon 2.7 IDE Pycharm 5.0.3 numpy 1.11.0目前接口库@MrLevo520–数据转化接口仍在不断更新目的 将混淆矩阵可视化展现出来准备工作 亲先安装numpy,matplotlib接口代码新建一个confusion_matrix_png.py文件,输入如下代码# -*- coding: utf-8 -*-import numpy as npim原创 2016-11-02 10:57:39 · 3810 阅读 · 2 评论 -
Git的使用总结
Python 2.7 MacOS Sierra 10.12.1前言 实习中的第一个小分享,刚好弥补了我想学git的一些需求,主要还是公司的gitlab代码管理相关,以后自己也可以上传github了git的安装 采用HomeBrew安装,HomeBrew官网 http://brew.sh/下载HomeBrew打开终端,输入/usr/bin/ruby -e "$(curl -fsSL ht原创 2017-01-02 21:50:15 · 1555 阅读 · 0 评论 -
解决:将.mat文件保存到.txt不带有科学计数法e-0
Python 2.7 IDE Pycharm 5.0.3 Matlab 2014a遇到问题在进行数据处理的时候,比如说我正好遇到KNN算法的python描述,但我的数据集是matlab的.mat文件,我想要用python处理数据的话,mat是不可行的,那怎么办呢?解决思路python能读入的是txt,现在数据很多也是存在txt中的(以我接触的一些数据来说),python读取txt是非常方便的,而原创 2016-09-08 13:53:20 · 8440 阅读 · 0 评论 -
Python用户存储加密及登录验证系统(乞丐版)
Python 2.7 IDE Pycharm 5.0.3今天接触到了MD5和SHA1加密算法,简单构思了一下用户的加密存储系统和登录系统,好吧,原谅我简单的思维和幼稚的代码,不过 i promise,这代码独一无二,也希望大家多自己动手,不要老是按部就班的学习(我貌似没有资格说吧,哈哈,不服过来打我啊)实现目的对原有的用户进行登录操作,可增加新用户,并且进行选择算法加密,数据库(字典)会更新,之原创 2016-06-30 14:08:17 · 2940 阅读 · 0 评论 -
__init__(self),self,super,继承杂谈
Python 2.7 IDE Pycharm 5.0.3 遇到问题,解决问题,才能不愧对自己花费的时间--小白语录建议首先阅读: @追梦的蜗牛果果–Python 继承之 self的解释 @LY_ysys629–python类class中init函数以及参数self的简单解释class类包含: 类的属性:类中所涉及的变量 类的方法:类中函数__init__函数(方法) 1.首原创 2016-06-29 15:38:39 · 5260 阅读 · 0 评论 -
最简单的理解lambda,map,reduce,filter,列表推导式
Python 2.7 IDE Pycharm 5.0.3为什么要用Lambda 一句话,因为懒,懒得新建一个一次性使用函数,懒得想函数名,想要更高逼格的pythontic!比如说,我要实现一个x*y+x的功能,没有lambda之前我要这样做:#定义一个函数def Whatever(x,y): return x*y+x#调用函数 f = Whatever(22,3)print原创 2016-09-21 18:15:27 · 3056 阅读 · 1 评论 -
Python编码规范(PEP8)及奇技淫巧(不断更新)
Python 2.7前言 从很多地方搬运+总结,以后根据这个标准再将python的一些奇技淫巧结合起来,写出更pythonic的代码~PEP8 编码规范英文原版请点击这里以下是@bobo的整理,原文请见PEP8 Python 编码规范整理 代码编排缩进。4个空格的缩进(编辑器都可以完成此功能),不使用Tap,更不能混合使用Tap和空格。每行最大长度79,换行可以使用反斜杠,最好使用圆括号原创 2017-04-04 19:18:00 · 17754 阅读 · 0 评论 -
Python基于Tkinter的二输入规则器(乞丐版)
Python 2.7 IDE Pycharm 5.0.3有想法就去做,等等等等就没机会了昨天接触了Tkinter框架,之后就迫不及待的想写个计算器出来,结果呢,可想而知了,当初自己犟脾气,掌握几个语法后就想什么都不参考写自己的一段四则运算器出来,结果。。。。。。花了我一天时间,我竟然歪打正着写了个规则器出来窝草。。。。贴个图,别人家的计算器是这样的;而且用了五十行,说的貌似很了不起的样子(老纸的原创 2016-07-02 18:47:32 · 3617 阅读 · 4 评论 -
利用N-Gram模型概括数据(Python描述)
decode的作用是将其他编码的字符串转换成unicode编码, 如str1.decode(‘gb2312’),表示将gb2312编码的字符串转换成unicode编码。 encode的作用是将unicode编码转换成其他编码的字符串, 如str2.encode(‘gb2312’),表示将unicode编码的字符串转换成gb2312编码。 import stringlist =原创 2016-08-08 16:45:14 · 15702 阅读 · 2 评论 -
将自己的python程序打包成.exe/.app(秀同学一脸呐)
Windows 10 x64macOS Sierra 10.12.4Python 2.7 准备好装哔~了么,来吧,做个真正意义上的绿色小软件Win下发布应用起因 今天实验室同学看到我的乞丐版二输入规则器,他挺感兴趣的,也想要玩玩,但是他没有装python的环境,总不能让他一直玩我电脑吧,所以想到了将程序打包成exe,直接运行!想法一出来,根本挡不住啊,说干就干,先百度python打包exe原创 2016-07-06 16:24:35 · 209995 阅读 · 42 评论 -
Python2.7中的super方法浅见
重写是继承机制中的重要内容,对于构造方法尤为重要。构造方法用来初始化新建对象的状态,大多数子类不仅要有自己的初始化代码,还要拥有超类的初始化代码。原创 2016-06-19 15:05:36 · 9528 阅读 · 0 评论 -
解决:NLTK包下载出错问题及NLP环境测试
Python 2.7 IDE Pycharm 5.0.3 NLTK 3.2.1前言 需要用到自然语言处理了,安装调试过程记录一下,省的下次再找 【注意:软件安装需求:Python、NLTK、NLTK-Data必须安装,NumPy和Matplotlin推荐安装,NetworkX和Prover9可选安装】安装详细过程可见Python与自然语言处理(一)搭建环原创 2016-10-26 16:42:25 · 6939 阅读 · 5 评论 -
Python读取写入TXT正确姿势
Python 2.7 IDE Pycharm 5.0.3在憋一个豆瓣电影抓取的“大招”,分流记录一下保存过程直奔主题1.自己写入txt直接上核心代码:with open("douban.txt","w") as f: f.write("这是个测试!")这句话自带文件关闭功能,所以和那些先open再write再close的方式来说,更加pythontic!结果就是这样:2.将文件输原创 2016-07-20 13:02:58 · 63429 阅读 · 3 评论 -
Python如何多次遍历文件及查找特定文件
Python 2.7 IDE Pycharm 5.0.3 刚学到文件流的操作,这个和Linux是一样的,所以比较好上手,难怪Python是运维的好助手啊,每天一点小知识。。。。首先来一个遍历小助手,刚开始读文件的时候,每次只能读完一次,而且用while 来写循环也出错,网上爬了下,找到seek()方法: fileObject.seek(offset[, whence])原创 2016-06-20 15:56:12 · 3923 阅读 · 1 评论 -
__setattr__,setattr(),getattr__,getattr()及__getattribute__的区别
Python 2.7 IDE Pycharm 5.0.3首先,给一波定义__setattr__(self,name,value)#当试图给特性name赋值时候自动被调用,其余方法同理#相当于触发机制__getattribute__(self,item)#每次通过实例化访问属性都会通过该函数#如果没有该属性,则访问完该函数后,再会通过__getattr__函数 _setattr_和_get原创 2016-06-19 16:36:10 · 2394 阅读 · 0 评论 -
解决Tkinter中grid/pack布局中的listbox,scrollbar组合横置
Python 2.7 IDE Pycharm 5.0.3其实这个不应该写,我认为网上很多关于grid和listbox的操作,但是!大家都抄来抄去!完全没有get到重点啊!一个错误的答案能传和转好多博客,我真是很无语。不知道博主们转之前有没有自己实际测试过,至少我试过。好啦,其实我想实现的很简单,如下图; 就是那么简单的一个listbox和scrollbar组合的玩意,当时用的是pa原创 2016-07-07 20:34:00 · 13305 阅读 · 6 评论 -
BeautifulSoup使用一两则(不定期补充)
Pycharm 5.0.3 IDE Pycharm BeautifulSoup 4.5.0如何在Pycharm下安装BeautifulSoup请看 致力于打造最详细的Requests使用(不定期补充) 还有强烈推荐@崔庆才–Python爬虫利器二之Beautiful Soup的用法不能更详细的用法介绍都说BeautifulSoup是利器,那就记录下bs的学习过程和代码示例原创 2016-07-28 17:14:14 · 1578 阅读 · 0 评论 -
Python与MySQL联动实例一两则
Python 2.7 IDE Pycharm 5.0.3 PyMySQL 0.7.6 MySQL 5.7 MySQL Workbench 6.3回家有点颓废了,练个小内容,把抓到的数据写到SQL里面,存起来,以后用作数据分析用吧。扫盲MySQL读法: “My Ess Que Ell”(not “my sequel”)来,跟我读,“My Ess Que Ell”哈哈,这可是官方说法,是不是原创 2016-08-01 10:38:03 · 2986 阅读 · 0 评论 -
Python小白带小白初涉多线程
Python 2.7 IDE Pycharm 5.0.3 首先,解释一下线程:简单来说,一个进程中包含多个线程,比如打开一个qq(进程),然后你一边聊qq(一个线程),一边用qq传送文件(一个线程),等等,比如Word,它可以同时进行打字、拼写检查、打印等事情。在一个进程内部,要同时干多件事,就需要同时运行多个“子任务”,我们把进程内的这些“子任务”称为线程(Thread)再者,引用廖雪峰大大的原创 2016-06-22 15:29:10 · 1483 阅读 · 0 评论 -
解决pdfminer ImportError: cannot import name process_pdf
Python 2.7 IDE Pycharm 5.0.3 pdfminer 20140328解决问题和测试多个版本读pdf解决问题在进行PDF读取的时候,遇到pdfminer ImportError: cannot import name process_pdf问题,各处搜索之后,除了stackoverflow的how to use pdfminer有比较好的总结之外,还是得看官方手册啊,这句原创 2016-08-06 15:54:20 · 34923 阅读 · 10 评论 -
伪解决Selenium中调用PhantomJS无法模拟点击(click)操作
Python 2.7 IDE Pycharm 5.0.3具体Selenium和PhantomJS配置及使用请看调用PhantomJS.exe自动续借图书馆书籍我一直以为,PhantomJS就是无界面的浏览器而已,用Selenium调用PhantomJS和调用Firefox并没有区别起因今天想写个爬豆瓣高分电影及评论的小爬虫,刚开始一直调用浏览器进行模拟登陆测试,之后换成调用PhantomJS之后原创 2016-07-19 17:59:01 · 17122 阅读 · 2 评论 -
解决Selenium弹出新页面无法定位元素问题(Unable to locate element)
Python 2.7 IDE Pycharm 5.0.3环境细节详见Python+Selenium+PIL+Tesseract真正自动识别验证码进行一键登录对于同一页面无法定位元素问题请见姊妹篇解决网页元素无法定位(NoSuchElementException: Unable to locate element)的几种方法 只解决一个问题--NoSuchElementException: Me原创 2016-07-16 20:13:37 · 104719 阅读 · 28 评论 -
在pycharm中抓取网页URL中文乱码解决方案
python2.7抓取网页url中文乱码解决方式原创 2016-06-14 14:19:47 · 10699 阅读 · 0 评论 -
Python下json.loads()中文字符出错解决
使用json.load()时,中文字符被转化为Unicode码的问题原创 2016-06-14 18:12:30 · 13720 阅读 · 0 评论 -
致力于打造最详细的Requests使用(不定期补充)
Python 2.7 IDE Pycharm 5.0.3 Requests 2.10是时候静心下来好好研究一下Requests了安装方法我这里只说在Pycharm+Anaconda2下怎么添加requests包,至于如何在Pycharm下安装Anaconda2,请看@zhusleep 和@木子岚的回答 然后安装大概是这样的,简单快捷,不用pip,不用easy install,anaconda原创 2016-07-23 20:40:43 · 9543 阅读 · 0 评论 -
2017校招去哪网,阿里,网易,中兴,华为笔试编程题五则(Python描述)
前言 学长忙着找工作,今天几轮笔试,把能拍到的笔试题都给我写了写,我想对明年找工作或者实习有所帮助第一题,去哪网笔试题题目我个人感觉难度还可以,我自己写了好久,三道题,一道重复,还有一题同学没拍到,总共时间给两个小时,时间给的久,相比有点道理。估计读题目就刷掉个一半了。。。。简单说一下(我同学翻译的,我自己懒得看),就是说,给定一串字符串,给定个分割阈值,然后进行分割,要是分割边界切坏了一个单原创 2016-09-09 21:44:08 · 2556 阅读 · 0 评论 -
Python爬虫防封杀方法集合
Python 2.7 IDE Pycharm 5.0.3前言在爬取的过程中难免发生ip被封和403错误等等,这都是网站检测出你是爬虫而进行反爬措施,这里自己总结下如何避免方法1:设置等待时间有一些网站的防范措施可能会因为你快速提交表单而把你当做机器人爬虫,比如说以非常人的速度下载图片,登录网站,爬取信息。常见的设置等待时间有两种,一种是显性等待时间(强制停几秒),一种是隐性等待时间(看具体情况,原创 2016-09-01 10:59:01 · 11126 阅读 · 4 评论 -
经纬度地址转换的方法集合(Python描述)
Python 2.7 IDE Pycharm 5.0.3 Geopy 1.11前言这只是我想做的一部分,写一块太大了,单独记录目的获取2015年GDP TOP100城市并获取城市对应经纬度,存入txt后续操作获取GDP TOP100城市查询网址如下http://www.redsh.com/a/20160126/171501.shtml 2015中国100大城市GDP排行榜TOP100出炉!原创 2016-09-16 17:16:59 · 15494 阅读 · 0 评论 -
基于Scrapy对更新后的Dmoz进行抓取(网上旧版本不靠谱)
IndentationError: unindent does not match any outer indentation levelImportError: No module named tutorial.itemsscrapy [boto] ERROR: Caught exception reading instance data原创 2016-06-28 19:28:51 · 2344 阅读 · 0 评论