- 博客(16)
- 资源 (20)
- 问答 (1)
- 收藏
- 关注
原创 Python正则表达式匹配各种标准形式整理
正则表达式用于字符串处理、表单验证等场合,实用高效。现将一些常用的表达式收集于此,以备不时之需。匹配中文字符的正则表达式: [\u4e00-\u9fa5]评注:匹配中文还真是个头疼的事,有了这个表达式就好办了匹配双字节字符(包括汉字在内):[^\x00-\xff]评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1)匹配空白行的正则表达式:\n\s*\r
2017-06-27 13:50:24 7075
原创 使用selenium模块模拟浏览器爬去网页,并进行点击定位内容笔记
针对模拟浏览器采用。webdriver.Firefox()火狐浏览器模拟Windows系统解决办法如下:1、下载geckodriver.exe:下载地址:https://github.com/mozilla/geckodriver/releases请根据系统版本选择下载;(如Windows 64位系统)2、下载解压后将getckodriver.exe复制到Fir
2017-06-26 15:17:31 2538
原创 python 报错'gbk' codec can't encode character '\ue5d1' in position 0:
在网络怕爬虫过程中遇到,编码错误'gbk' codec can't encode character '\ue5d1' in position 0: illegal multibyte sequenceresponse = requests.get(url)html_uid = response.text# name=html_uid["result"]['name']# pat
2017-06-17 16:08:35 3445
转载 python文件打开方式详解——a、a+、r+、w+区别
第一步 排除文件打开方式错误:r只读,r+读写,不创建w新建只写,w+新建读写,二者都会将文件内容清零(以w方式打开,不能读出。w+可读写)**w+与r+区别:r+:可读可写,若文件不存在,报错;w+: 可读可写,若文件不存在,创建r+与a+区别:[python]fd = open("1.txt",'w+') fd.write('123')
2017-06-14 19:13:43 4789
原创 Python中map函数
python中的map()函数map(function, iterable, ...)1.对可迭代函数'iterable'中的每一个元素应用‘function’方法,将结果作为list返回。>> def add100(x):... return x+100... >>> hh = [11,22,33]>>> map(add100,hh)[111, 122, 1
2017-06-10 22:06:57 1785
原创 运行map()后,报:map object at 0x026427B0 <map>解决方法与原因分析
2018博客之星评选,如果喜欢我的文章,请投我一票,编号:No.009 [支持连接]() ,万分感谢!!!1 如下python 3例子:l = range(1,21)def op(x): r = 1 for i in range(1,x + 1): r *= i return rlist1 = (map(op,l))print (list1...
2017-06-09 14:32:25 12838 3
原创 Python笔记从html中提取字段
def fun(): # url = 'http://quote.eastmoney.com/sh600010.html?from=BaiduAladdin' url_total = 'http://api.map.baidu.com/place/v2/search?q=景区&page_size=20&page_num=1®ion=白山市&scope=2&output=jso
2017-06-07 21:29:25 3514
原创 python中从str中提取元素到list以及将list转换为str
在Python中时常需要从字符串类型str中提取元素到一个数组list中,例如str是一个逗号隔开的姓名名单,需要将每个名字提取到一个元素为str型的list中。如姓名列表str = 'Alice, Bob, John',需要将其提取为name_list = ['Alice', 'Bob', 'John']。而反过来有时需要将一个list中的字符元素按照指定的分隔符拼接成一个完整的
2017-06-07 19:37:39 2671
原创 windows下多版本python环境变量设置与pip不同版本方法(三步骤)
1。对于两个版本首先要添加进去环境变量,这个很简单,网上有很多,一半找到文件所属目录即可,即文件属性(F:\anaconda2)2.对于两个版本的python分别命名python2与python33.指定安装包(pip)win+r ------->cmd-------> python3 -m pip install Pillow 其中Pillow是包
2017-06-05 14:45:47 4573
原创 Python中的__init__()方法整理中(两种解释)
解释一:看懂了就不用看第二种了__init__()方法是Python学习当中重要的基础知识,__init__()方法意义重大的原因有两个。第一个原因是在对象生命周期中初始化是最重要的一步;每个对象必须正确初始化后才能正常工作。第二个原因是__init__()参数值可以有多种形式。因为有很多种方式为__init__()提供参数值,对于对象创建有大量的用例,我们可以看看其中的几个。我们
2017-06-05 00:19:29 15410 1
原创 python2.7进行爬虫百度POI代码(划分小网格算法)
查询许久,最终选择一个,之前一直py3.6不成功,换了2.7就好多了。如果有重复去下重即可。这里面非常重要的基类对象的init()方法与超类方法,将在下面进行记录。# -*- coding:utf-8 -*-import jsonimport urllib2import sysimport impimport time#显示当前系统编码print(sys.getdefau
2017-06-04 23:52:25 2646
原创 网页爬虫-R语言实现基本函数
#*************网页爬虫-R语言实现,函数库文件*******##****作者:H***************************************##****版本:v0.1*******************************************##****时间:2017*************************************#library
2017-06-04 20:07:17 1387
原创 Python中的random模块用于生成随机数
Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。 random.randomrandom.random()用于生成一个0到1的随机符点数: 0 random.uniform random.uniform的函数原型为:random.uniform(a, b),用于生成一个指定范围内的随机符点数,两个参数其中一个是上限,
2017-06-01 22:55:04 2044
原创 Python 2.7.x 和 Python 3.x 的主要区别
参考网址:http://www.kuqin.com/shuoit/20140728/341451.html点击打开链接
2017-06-01 22:20:17 680
原创 Python 用OPEN读文件报错 ,路径以及r
Python 中 ‘unicodeescape’ codec can’t decode bytes in position XXX: trun错误解决方案背景描述今天在运用Python pillow模块处理图片时遇到一个错误SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position
2017-06-01 21:45:56 4344
原创 Python信贷数据处理与初步分析(ZIP解压)
#!/usr/bin/python# coding=utf-8''' @author: lenovo@software: 3.6 PyCharm@file: 8W信贷数据处理.py@time: 20170531@function:Credit data processing and preliminary analysis 信贷数据处理与初步分析@ed
2017-06-01 13:45:36 2252
Scalable Modified Kneser-Ney Language Model Estimation语言模型PPT
2018-11-19
mabaXterm ssh linux连接工具,一个非常好用的工具
2018-08-03
数学建模模板(建模论文竞赛标准版)
2018-01-13
window_mongodb执行过程个人笔记——不建议下载.txt
2017-10-17
pagerank算法英文文档
2017-09-20
基于最小领域知识的主题建模 :Topic Modeling with Minimal Domain Knowledge
2017-09-19
TextRank算法的参考资料论文
2017-09-19
高德地图API POI分类编码表
2017-09-19
python wordcloud-1.3.1-cp36-cp36m-win_amd64.wh
2017-06-07
cw2vec相关资料,cw2vec论文与Word Vectors
2010-01-11
一个网站之前可以访问,没有做任何处理,现在报错500,麻烦帮忙看下,不知如何解决
2017-10-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人