![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python
文章平均质量分 68
我是小水水啊
静
展开
-
python 操作sqlite3数据库
= 修改数据库==原创 2023-07-28 03:15:25 · 268 阅读 · 0 评论 -
Apriori关联规则算法
实现购物篮分析# 这里是吧每一个数据加上一个','df1['Goods'] = df1['Goods'].apply(lambda x:','+x) # 这里是将所有买的物品的字符串合在一起df4=df1.groupby('id').sum()# 把分好的物品变为列表df4["Goods"]=df4["Goods"].apply(lambda x:x[1:].split(","))上面的操作就是为了实现下面的 表这下面写的是 相关性分析的函数data=list(df4.Goods)原创 2022-10-24 12:21:05 · 139 阅读 · 0 评论 -
爬虫 selenium
selenium的基本用法slenium的基本用法:1:怎么去截图的用法:2:没有界面的浏览器驱动:phantomJS3:模仿百度的搜索:4:driver 对象的常用属性的方法:5:driver 对象的获取标签的方法6:对标签元素的操作:7:用selenium 获取cookie 的 方法:8,注意事项:slenium的基本用法:1:怎么去截图的用法:from selenium import webdriver# 1: 创建浏览器驱动对象driver = webdriver.Chrome()#原创 2022-09-12 03:34:57 · 180 阅读 · 0 评论 -
matplotlib
@你好原创 2022-09-12 03:33:01 · 1212 阅读 · 0 评论 -
机器学习基础
文章目录机器学习算法分类分类问题回归问题机器学习算法分类监督学习分类 : k-近邻算法、贝叶斯分类、决策树与随机森林、逻辑回归、神经网络 回归 线性回归、岭回归, 隐马尔可夫模型无监督学习聚类 k-means监督学习:(英语:Supervised learning),可以由输入数据中学到或建立一个模型,并依此模式推测新的结果。输入数据是由输入特征值和目标值所组成。函数的输出可以是一个连续的值(称为回归),或是输出是有限个离散值(称作分类)。无监督学习(英语:Supervi原创 2022-05-12 12:34:19 · 2578 阅读 · 0 评论 -
机器学习_特征值的选择
数据的降维简介VariancerThreshouldPCA简介特征选择就是单纯地从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值、也不改变值,但是选择后的特征维数肯定比选择前小,毕竟我们只选择了其中的一部分特征。主要方法:(三大武器):Filter(过滤式):VariancerThreshouldEmbedded(嵌入式):正则化,决策树Wrapper(包裹式)神经网络VariancerThreshould删除低方差from sklearn.featu原创 2022-05-12 12:33:48 · 1112 阅读 · 0 评论 -
机器学习__特征工程
数据的提取数据集的网站常用数据集的结构组成特征工程的描述字典特征数据抽取文本的特征抽取数据集的网站kaggle:https://www.kaggle.com/uci:http://archive.ics.uci.edu/ml/index.phpscikit-learn:https://scikit-learn.org/stable/index.html常用数据集的结构组成结构: 特征值+目标值注意:有些数据集可能没有目标值,机器学习,一般重复数据一般不会影响特征工程的描述特征工程是原创 2022-05-12 12:33:31 · 509 阅读 · 0 评论 -
pyppeteer 爬虫
pyppeteer工作原理预备知识:协程launch的其它参数基本框架浏览器截图保存为 PDF执行 JavaScript防止被检测为自动控制工具,webdriver 检测问题恢复上次登录状态(保存cookie)获取元素xpathCSS选择器判断是否有滑块 .Jeval对相应元素输入值鼠标事件键盘事件点击登陆设置请求头等待事件拉到页面最底部获取网页源代码工作原理启动一个浏览器Chromium,用浏览器装入网页。浏览器可以用无头模式(headless),即隐藏模式启动,也可以显式启动从浏览器可以获取网原创 2022-05-12 12:33:07 · 1438 阅读 · 0 评论 -
用Pillow处理图像
用Pillow处理图像图像的常识图像的缩放图像的旋转、翻转图像、和滤镜效果图像的裁剪图像的素描化给图像添加水印注意,安装时 pip install pillow图像的常识图像由像素构成屏幕上每个像素由3个距离非常近的点构成,分别显示红、绿、蓝三种颜色,每个像素可以由一个元组(r,g,b)表示,r,g,b通常是不超过255的整数图像模式:RGB: 一个像素有红、绿、蓝三个分量RGBA: 一个像素有红、绿、蓝三个分量,以及透明度分量CYMK: 一个像素有有青色(Cyan)、洋红色(Magent原创 2022-05-12 12:32:18 · 261 阅读 · 0 评论 -
处理excel文档
openpyxlopenpyxl读取excel文件内容读取公式的计算结果注意: pip install openpyxl (不支持Python 3.5及以前版本)openpyxl读取excel文件内容import openpyxl as pxlbook = pxl.load_workbook("c:/tmp/test.xlsx") #book就是整个excel文件sheet = book.worksheets[0] #取第0张工作表print(sheet.title) #输出工作表名字(显示于工原创 2022-05-12 12:31:45 · 259 阅读 · 0 评论 -
用random库 处理随机事务
random库random库中的函数random库中的函数random.random()随机生成一个[0,1]之间的数random.uniform(x,y)随机生成一个[x,y]之间的数(含两端,下同)。x,y可以是小数random.randint(x,y) 随机生成一个[x,y]之间的整数。x,y都是整数random.randrange(x,y,z) 在range(x,y,z)中随机取一个数random.choice(x) 从序列x中随机取一个元素。x可以是为列表、元组、字符串random.原创 2022-05-12 12:31:25 · 48 阅读 · 0 评论 -
python文件的读取
文件的读取创建文件并写入内容读取现有文件:文件打开模式:文本文件的编码python程序的编码路径相对路径绝对路径形式: 文件名包含盘符open函数打开文件,将返回值放入一个变量,例如 f用f.write函数写入文件用f.readlines()函数读取全部文件内容用f.readline()函数读取文件一行用f.close()函数关闭文件用f.read()读取全部文件内容。返回一个字符串,包含文件全部内容创建文件并写入内容a = open("c:\\tmp\\t.txt","w") #文件原创 2022-05-12 12:30:42 · 426 阅读 · 0 评论 -
python八种基本数据类型
python笔记吧!数字类型数值类型转换:数字函数制度的转换字符串索引:切片:字符的运算字符串函数格式化(fromat)解码编码列表修改列表列表函数与方法元组字典字典的方法:集合取二维数组的列简单方法:数字类型数值类型转换:int(x) 将x转换为一个整数。float(x) 将x转换到一个浮点数。complex(x) 将x转换到一个复数,实数部分为 x,虚数部分为 0。complex(x, y) 将 x 和 y 转换到一个复数,实数部分为 x,虚数部分为 y。x 和 y 是数字表原创 2022-05-12 12:29:55 · 3907 阅读 · 0 评论 -
python os
python os提取后缀名提取后缀名suffix=os.path.splitext(“文件名称”)原创 2022-05-12 12:28:48 · 71 阅读 · 0 评论 -
Python文件操作
文章目录1,批量修改文件名2 ,返回文件夹下所有指定文件名3,文件夹不存在时自动创建4,打印当前运行环境5,获取指定文件夹下内存大小6, 定时关机或重启1,批量修改文件名日常工作中,可能会有这样的需求:把一个文件夹下所有 jpg 图片转化为 png ;假设文件夹下只有4、5 张,手动修改的话是没问题,但如果数量达到上百张,就有点让人头疼,这个代码块正是用来解决此类问题的import osdef batch_rename(work_dir, old_ext, new_ext): # fil原创 2022-04-23 16:48:39 · 65 阅读 · 0 评论 -
gensim.corpora中Dictionaryd的用法
gensim.corpora原创 2021-12-30 15:58:45 · 514 阅读 · 0 评论 -
re正则表达式
re正则表达式中的特殊字符范围符号[ ]和量词字符/组合匹配的模式正则表达式匹配的字符串.除’\n’外的任意一个字符,包括汉字(多行匹配方式下也能匹配’\n’)‘a.b’‘acb’ ‘adb’ 'a(b’等*量词。表示左边的字符可出现0次或任意多次‘a*b’‘b’ ‘ab’ 'aaaab’等?量词。表示左边的字符必须出现0次或1次‘ka?b’‘kb’ 'kab’等+量词。表示左边的字符必须出现1次或更多次‘ka+b’‘kab’ ’原创 2021-11-14 15:11:38 · 739 阅读 · 0 评论 -
datetime处理日期时间
datetime处理日期处理时刻datetime的局限:能处理的时间,年份是公元1年至9999年处理日期import datetime #导入datetime模块dtBirth = datetime.date(2000,9,27) #创建日期对象,日期为2000年9月27日print(dtBirth.weekday()) #>>2 输出dtBirth代表的日期是星期几。0表示星期一dtNow = datetime.date.today() #取今天日期,假设是 2020年8月15日原创 2021-10-29 15:36:13 · 622 阅读 · 0 评论 -
python 之 匿名函数
python 之 匿名函数5.14 匿名函数lambda x , y : x+y1 匿名的目的就是要没有名字,给匿名函数赋给一个名字是没有意义的2 匿名函数的参数规则、作用域关系与有名函数是一样的3 匿名函数的函数体通常应该是 一个表达式,该表达式必须要有一个返回值f=lambda x,n:x ** nprint(f(2,3))**lambda匿名函数的应用:**max,min,sorted,map,reduce,filter求工资最高的人:maxsalaries={ 'eg转载 2021-07-30 00:19:29 · 924 阅读 · 0 评论 -
图像的手绘效果
图像是一个三维数组,维度分别是高度、宽度和像素RGB值转载 2021-07-23 15:34:25 · 73 阅读 · 0 评论 -
python :requests,beautfulsoup,re
python爬虫request库的应用指针的应用场景request库的应用requests.get(url,params=None,**kwargs)url :获取url链接params :url中的额外参数,字典或字节流格式,可选**kwargs:12个控制访问的参数首先建立一个对象r:r=requests.get(“这里面写的是网址!”)requests 对象的属性有:r.status_code 如果出现200就是成功 出现其他的就是失败!r.e原创 2021-06-20 21:01:41 · 296 阅读 · 0 评论 -
scrapy基础知识
scrapy基础scrapy的工程建立pipelines 的使用scrapy的工程建立win10 cmd相应命令行:cd c:/jj 到c盘jj文件清除cmd的所有文字cls1.创建一个scarpy的项目: scarpy startproject name —name 是工程名字2.生成一个爬虫在文件里面有sprider文件建立一个爬虫scarpy genspider name “xxxxx” -----name 是文件名字, xxx是限制3.完善爬虫4.运行爬虫在建立工原创 2021-06-20 20:58:12 · 759 阅读 · 0 评论 -
python csv 的读取和存入
文件存储方法 csv读取csv 文件:存储csv读取csv 文件:import csvwith open('文件名.csv',"r") as f: read 是一个迭代器 read=csv.reader(f) 1.这个能够打印出所有的行(带标题),遍历后是列表类型 for x in read: print(x) 2.不要标题 ,打印,遍历是字典类型 next(read) for x in read: prin原创 2021-05-25 21:04:09 · 286 阅读 · 0 评论 -
爬虫urllib
pyhton urlliburlopenurlretriexe 函数 下载网页文件urlencode函数:(url的编码)parse_qs 函数:(url解码)urlparse 和urlsplit(分割网站的用法)访问网页1(反爬虫)ProxyHandler 处理器(代理设置)cookie 的格式用cookie登录urlopenform urllib import requestresp=request.urlopen("http://www.baiud.com")print(reso.read()原创 2021-05-10 21:25:41 · 89 阅读 · 0 评论 -
python 多线程
多线程threading 库的使用threading 库的使用原创 2021-05-07 12:03:58 · 114 阅读 · 0 评论 -
json,xpath,lxml 笔记
json用法基本的知识:基本的知识:json.loads()把json字符串转化为python类型,返回python类型,里面是json类型json.dumps() 能够把python类型转化为json字符串,这个是可以用来存在文件里,这个存文件经常用.ensurn_ascii=False 这个参数是不用ACSII编码,中文就可以显示出来,然后indent=4 是让他空格为4让存的文件更加好看!而且读取的时候也没用问题.例如:json.load() 和json.dump()json.lo原创 2021-05-06 18:04:05 · 214 阅读 · 1 评论