python
chang___hong
这个作者很懒,什么都没留下…
展开
-
python基础模块
1.字符串类型:str类型和unicode类型 str类型采用的ASCII编码,也就是说它无法表示中文。 unicode类型采用unicode编码,能够表示任意的字符。 2.转义和原始字符 3.输入格式 raw_input():不论输入的是什么,一律认为是字符串 input():根据输入的类型判断 4.编码转换 *问题1. “UnicodeDecod原创 2017-03-22 10:27:37 · 450 阅读 · 0 评论 -
Pandas模块1
常用的两个数据结构:Serious和DataFrame Serious:表示一维数组#! /user/bin/env python#encoding=utf-8__author__ = 'chw'import pandas as pdfrom pandas import Series,DataFrameprint Series([1,2,4,5])print Series([1,2,5原创 2017-05-16 22:22:30 · 376 阅读 · 0 评论 -
知乎账号登录+验证码
#! /user/bin/env python#encoding=utf-8__author__ = 'chw'import re# from urllib import parse, requestimport cookielibimport urllib2,urllibfrom PIL import Imageimport timeimport json# 建立LWPCooki原创 2017-05-19 16:09:06 · 3319 阅读 · 0 评论 -
中文编码问题:raw_input输入、文件读取、变量比较等str、unicode、utf-8转换问题
http://blog.csdn.net/eastmount/article/details/48841593转载 2017-05-20 10:38:42 · 571 阅读 · 0 评论 -
selenium抓取四六级成绩
#! /user/bin/env python#encoding=utf-8from selenium import webdriverdrive=webdriver.PhantomJS('C:\Anaconda2\Scripts\phantomjs\\bin\phantomjs.exe')url='http://www.chsi.com.cn/cet/query'drive.get(ur原创 2017-05-20 11:00:16 · 508 阅读 · 0 评论 -
python画图包matplotlib
中文乱码解决方法注意绘图时中文的解决方法, 在.py文件头部加上如下内容:# -- coding: utf-8 -- from pylab import * mpl.rcParams[‘font.sans-serif’] = [‘SimHei’] #指定默认字体 mpl.rcParams[‘axes.unicode_minus’] = False #解决保存图像是负号’-‘显示为方块的问题 i原创 2017-09-06 22:23:26 · 3521 阅读 · 0 评论 -
理解Cookie和Session机制2
目录[-]•Cookie机制 •什么是Cookie •记录用户访问次数 •Cookie的不可跨域名性 •Unicode编码:保存中文 •BASE64编码:保存二进制图片 •设置Cookie的所有属性 •Cookie的有效期 •Cookie的修改、删除 •Cookie的域名 •Cookie的路径 •Cookie的安全属性 •JavaScript操作Cookie •案例:永久登转载 2017-08-31 20:08:07 · 221 阅读 · 0 评论 -
理解Cookie和Session机制(转)
理解Cookie和Session机制(转) 理解Cookie和Session机制(转) 目录[-]Cookie机制什么是Cookie记录用户访问次数Cookie的不可跨域名性Unicode编码:保存中文BASE64编码:保存二进制图片设转载 2017-05-08 09:44:46 · 380 阅读 · 0 评论 -
Pandas模块2
#! /user/bin/env python#encoding=utf-8__author__ = 'chw'from pandas import Series,DataFrameimport pandas as pd**# 重新索引**# Series 对象的重新索引通过其 .reindex(index=None,**kwargs) 方法实现。# **kwargs 中常用的参数有俩转载 2017-05-17 19:21:28 · 384 阅读 · 0 评论 -
pandas常用于数据处理的模块
1、合并操作pandas.mergepandas.merge(left, right, how=’inner’, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=False, suffixes=(‘_x’, ‘_y’), copy=True, indicator=False)作用:通过执行转载 2017-12-29 11:05:34 · 469 阅读 · 0 评论 -
安装lightGBM和xgboost
安装lightGBM 参考:http://blog.csdn.net/qq_22238533/article/details/72927755安装xgboost 参考:http://m.blog.csdn.net/ychanmy/article/details/50972530 出现问题:解决方案:因为Anaconda自己有个libstdc++-6.dll已经过期了,所以需要用新原创 2018-01-04 22:14:41 · 1406 阅读 · 0 评论 -
Python future模块
Python编程语言中有很多比较有用的模块,这些模块在实际使用中可以帮助我们轻松的完成许多功能需求。我们今天将会在这里通过对Python future模块的了解,来对这方面的知识做一个详细的了解。今天在学习Python Cookbook的时候,发现一句语法from future import division,很奇怪future这个名字,网上搜了一下,原来是很有用的一个模块。详细说明见这里。按照官方转载 2017-05-07 21:31:53 · 780 阅读 · 0 评论 -
文件读写+数据格式转换
只管打开文件,并在需要时使用它,Python自会在合适的时候自动将其关闭 .strip():表示去除两端的空格 lstrip():表示去除左侧的空格 rstrip():表示去除右侧的空格#! /user/bin/env python#encoding=utf-8__author__ = 'chw'import time# "w":表示覆盖# "r":表示读取 文件存在,读取;不存在,原创 2017-05-07 09:35:34 · 404 阅读 · 0 评论 -
多线程
主要用threading模块 1 Thread 普通创建#! /user/bin/env python#encoding=utf-8__author__ = 'chw'import threadingimport timedef run(n): print ("start:"+n) # time.sleep(3) print ("end:"+n)if __na原创 2017-05-06 17:12:22 · 252 阅读 · 0 评论 -
snmp安装
linux系统安装 net-snmp http://www.cnblogs.com/VRS_technology/archive/2010/08/12/1798191.html http://blog.chinaunix.net/uid-11751120-id-3226146.html http://www.verydemo.com/demo_c167_i2390.html https://原创 2017-03-29 20:33:02 · 269 阅读 · 0 评论 -
scrapy中spider
抓取单个网页: parse(response):回调函数中response表示url中提取的内容抓取多个网页(并且链接其他网页) rules = ( ##下面是符合规则的网址,但是不抓取内容,只是提取该页的链接 #Rule(SgmlLinkExtractor(allow=('huhuuu/default.html?page=([w]+)',), )),原创 2017-03-25 17:31:34 · 342 阅读 · 0 评论 -
scrapy爬虫不会被禁止
根据scrapy官方文档: http://doc.scrapy.org/en/master/topics/practices.html#avoiding-getting-banned 里面的描述,要防止scrapy被ban,主要有以下几个策略。动态设置user agent 禁用cookies 设置延迟下载 使用 Google cache 使用IP地址池( Tor project 、VPN和代转载 2017-03-26 17:05:36 · 750 阅读 · 0 评论 -
装饰器
基础的部分能够看懂,但是感觉还是不太懂,主要是没有应用吧。 参考:http://python.jobbole.com/85393/ http://www.cnblogs.com/huxi/archive/2011/03/01/1967600.html http://www.jianshu.com/p/d68c6da1587a http://blog.csdn.net/mdl13412/art原创 2017-03-27 10:41:32 · 212 阅读 · 0 评论 -
Numpy详解
http://blog.sina.com.cn/s/blog_13bb711fd0102w68d.html原创 2017-05-10 11:12:09 · 740 阅读 · 0 评论 -
Numpy详解
http://blog.sina.com.cn/s/blog_13bb711fd0102w68d.html转载 2017-05-12 16:18:32 · 325 阅读 · 0 评论 -
lxml教程
首先考虑3个问题: 1:有一个XML文件,如何解析 2:解析后,如果查找、定位某个标签 3:定位后如何操作标签,比如访问属性、文本内容等 首先导入:from lxml import etree Element类 Element是XML处理的核心类,Element对象可以直观的理解为XML的节点,大部分XML节点的处理都是围绕该类进行的。这部分包括三个内容:节点的操作、节点属性的操作、节转载 2017-05-12 16:54:13 · 1508 阅读 · 0 评论 -
python编写PSO算法
关键在于赋值的关系: 浅赋值:对原来的引用 深度赋值:才是对值影响#! /user/bin/env python#encoding=utf-8__author__ = 'chw'import timeimport numpy as npimport copyimport matplotlib.pyplot as pltstart=time.time()c1=2c2=2PopM原创 2017-05-11 10:58:31 · 1949 阅读 · 2 评论 -
百度账号登陆
#! /user/bin/env python#encoding=utf-8__author__ = 'chw'import urllib2import urllibimport cookielibimport reimport chardetURL_BAIDU_INDEX = u'http://www.baidu.com/'#https://passport.baidu.com/转载 2017-05-14 18:25:55 · 1251 阅读 · 0 评论 -
为什么在Python里推荐使用多进程而不是多线程?
经常我们会听到老手说:“Python下多线程是鸡肋,推荐使用多进程!”,但是为什么这么说呢? 要知其然,更要知其所以然。所以有了下面的深入研究: 首先强调背景: 1、GIL是什么? GIL的全称是Global Interpreter Lock(全局解释器锁),来源是python设计之初的考虑,为了数据安全所做的决定。 2、每个CPU在同一时间只能执行一个线程(在单核转载 2017-05-06 16:32:35 · 447 阅读 · 0 评论 -
动态规划
1.编辑距离思路:如果word1[i]==word2[j],a[i][j]=a[i-1][j-1];如果word1[i]!=word2[j],a[i][j]=a[i-1][j]+1, word2尾后添加word1[i]如果word1[i]!=word2[j],a[i][j]=a[i][j-1]+1;word2删除尾后元素;如果word1[i]!=word2[j],a[i][j]=a[i-...原创 2019-05-08 10:46:18 · 146 阅读 · 0 评论