![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Python
Python
李 克 鹏
这个作者很懒,什么都没留下…
展开
-
正则表达式基础用法
爬虫部分示例import requestsurl = “ ”html = requests.get(url).text获取到的内容示例444545,px:"103.4562315689",py:"30.66541234",iskey:"1"正则用法示例import rer = re.compile(r'px:"(\d{3}.\d{1,})",py:"(\d{2}.\d{1,})",iskey')print(re.findall(r,html))[("103.45623原创 2022-05-08 22:13:39 · 318 阅读 · 0 评论 -
XPath基本用法
绝对路径:/step/step/...相对路径://step/step/....<div class="article-type article-type-yc" data-v-6fe2b6a7="">原创</div>提取元数据:a/text() --------> 原创提取属性数据:a/@class --------> article-type article-type-yc提取目标数据://div[@class="article-typ原创 2022-05-08 21:58:29 · 446 阅读 · 0 评论 -
scrapy基本流程
1、创建项目在目标文件夹里点击文件夹路径、输入CMD并回车、进入命令行输入命令:scrapy startproject **Spider2、创建爬虫cd 进入项目文件输入命令:scrapy genspider demo "demo.cn"demo为爬虫名称"demo.cn"为爬取网站的域名,后续可删除注意爬虫名称不要和项目名称重复3、项目根目录建立main.py文件main.py文件输入以下内容from scrapy.cmdline import .原创 2022-05-02 11:03:25 · 375 阅读 · 0 评论 -
pandas读写csv和xlsx
import pandas as pdimport numpy as np1、读写csvpath = '.../111.csv'读data = pd.read_csv(path, index_col=0) index_col为标题的序号写list1 = [[1, 1, 1, 1], [2, 2, 2, 2]]dt1 = pd.DataFrame(list1)dt1.to_csv(path, mode='w') //w为一次性写入,a可多次添加2、读写xlsx原创 2022-04-30 16:19:08 · 640 阅读 · 0 评论 -
python之xlrd
学习目标:提示:这里可以添加学习目标例如:一周掌握 Java 入门知识1、准备工作:import xlrd # 导入模块data = xlrd.open_workbook(filename) # 文件名以及文件路径,若有中文则加一个r/table = data.sheets()[0] # 按索引顺序获取table = data.sheet_by_index() # 按索引顺序获取ta原创 2021-10-05 10:18:44 · 2310 阅读 · 0 评论 -
python实现多元线性回归
近期论文用到多元线性回归方程,想到用python来做,通过在网上搜索以后做出以下总结:只有 代码+注释具体 多元线性回归 相关的数学知识请自行搜索引入相关模块import pandas as pdimport seaborn as snsfrom sklearn.linear_model import LinearRegressionimport matplotlib.pyplot as pltfrom sklearn.model_selection import train_t.原创 2020-12-22 20:27:53 · 2451 阅读 · 2 评论 -
python获取列表某个值的索引
利用a.index(target)其中a是目标list,target是需要的目标值a = [1,5,8,9,b]print(a.index(5))#输出索引值为1获取最值的索引:index.(max(s))index.(min(s))原创 2020-12-22 16:17:02 · 11948 阅读 · 0 评论 -
openpyxl的一些常用代码
把自己用到的一些代码放到这,不断更新,方便以后查看。1.安装及帮助文档命令行:pip install openpyxl速度慢的可以参考此镜像源,将最后的pandas替换为openpyxl即可官方帮助文档请点击此处2.具体用法:1、新建import openpyxl# 实例化wb = openpyxl.Workbook()# 激活 worksheetws = wb.active2、打开import openpyxl# 实例化wb = openpyxl.load_workboo原创 2020-12-16 13:44:47 · 696 阅读 · 0 评论 -
python的国内镜像源,保存一下省得以后再找了
记录一下:pip install -i https://pypi.doubanio.com/simple/ --trusted-host pypi.doubanio.comd pandas原创 2020-12-14 20:54:14 · 229 阅读 · 0 评论 -
报错module ‘urllib‘ has no attribute ‘request‘的解决方法
一步到位将import urllib改成import urllib.request即可解决…原创 2020-12-09 21:38:26 · 1224 阅读 · 0 评论