- 博客(19)
- 收藏
- 关注
原创 简单静态网页爬取
一、静态网页爬取概述1,静态网页介绍2.简单静态网页爬取二、使用urllib3实现HTTP请求1.使用urllib3库实现每一信息资源都有统一的且在网上唯一的地址,该地址就叫URL使用浏览器为火狐和chrome浏览器,操作系统为“Windows NT 6.1; Win64; x64”请求重试设置生成完整HTTP请求网页 User-Agent 的获取1.网页内右击鼠标点检查2.点Network3.按 ctrl+R 刷新2.使用requests库实现...
2021-05-05 12:15:37 3495
原创 python爬虫环境与爬虫
一、认识爬虫1.爬虫的概念2.爬虫的原理3.爬虫的合法性与robots协议4.爬虫的合法性与robot.txt协议二、认识反爬虫1.网站反爬虫的目的与手段容易被破解(只要提交的user-agent不带有爬虫这些字眼,就可以获取数据)2.爬取策略制定三、配置Python爬虫环境1.Python爬虫相关库与配置...
2021-04-30 21:13:06 172
原创 使用scikit-learn构建模型
一、使用scikit-learn构建模型1.加载datasets模块中数据集2.将数据集划分为训练集和测试集3.使用sklearn转换器进行数据预处理与降维二、构建并评估聚类模型1.使用sklearn估计器构建聚类模型2.评价聚类模型轮廓系数法不能数据较大,会报错,计算量太大,无法在电脑上运行,可改用指数评价法三、构建并评估分类模型1.使用sklearn估计器构建分类模型2.评价分类模型四、构建并评价回归模型1.使用sklearn估计器构建回归模
2021-04-30 10:41:16 691
原创 Pandas统计分析基础
一、读写不同数据源的数据1.数据库文件的读写2.文本文件的读写常见的的中文编码方式有两种,‘utf_8’ 和 ‘gbk’utf_8不能正确检码时,改用‘gbk’报错:原因:读取文件地址中含有中文解决方法:engine=“python”保存并删除索引列3.Excel文件的读写二、DataFrame的常用操作基础属性1.增删改查DataFrame数据可以看到data2中的 ” order_id “ 都改为了45
2021-04-24 21:47:03 364
原创 Matplotlib数据可视化基础
一、掌握pyplot基础语法注:如果图片显示空白,原因是:在 plt.show() 后调用了 plt.savefig() ,在 plt.show() 后实际上已经创建了一个新的空白的图片(坐标轴),这时候你再 plt.savefig() 就会保存这个新生成的空白图片。2.绘制散点图3.绘制折线图...
2021-04-21 21:18:49 110
原创 Anaconda:There is an instance of anaconda navigator already running error
一、问题:Anaconda Navigator打不开,并提醒There is an instance of anaconda navigator already running二、原因:你已经打开了多个anaconda navigator三、解决方法:windows+r 打开cmd1.在cmd窗口输入命令语句:tasklist|findstr “pythonw”注意:只有findstr和"pythonw"间有一个空格2.在cmd窗口输入命令语句:taskkill /pid 4368 /
2021-04-12 20:36:07 9661 11
原创 python面向对象与模块
1.方法和函数的区别方法面向对象,方法是定义在类里面的函数函数不需要跟在对象后面#面向对象a=[2.3,'hello','world',4]a.append('wine')print(a)string='My name'# string.append('Y') #字符串没有append方法,会报错a.split() #split是字符串对象才有的方法print(a) #print(),int(
2021-04-12 16:24:27 180
原创 python函数
1.自定义函数#自定义函数#第一种方式def Sum(x,y): #前面的参数指定具体的值了,后面的参数也必须指定。但如果后面的参数指定了,前面的参数可以不指定 return x+ya=Sum(1,2)print(a)#第二种方式y=lambda x:x**2y1=lambda x:x[1]b=y(10)c=y1(['hello',0])print(b)print(c)310002.练习:自定义求序列偶数个数的函数#练习:自定义求序列偶数
2021-04-11 20:11:58 189
原创 python文件读取操作
1.python文件读取#文件操作f=open('Walden.txt','r') #以只读的方式打开#txt=f.read() #读取文件内容txt_lines=f.readlines() #读取文件内容 读取所有行,按行读取,每读完一行就换行'\n' #txt_100=f.read(100) #加参数,读取前100个字符#不能同时用多种读取方式,要把其他的注释掉f.close()
2021-04-11 16:36:50 324
原创 字典的学习
1.字典的创建及索引a={'h':'hello',0.5:[0.2,0.3],'w':'world'}print(a)b=a[0.5] #字典中的元素无先后顺序,字典是用键来索引的print(b)#出现相同的键则覆盖#列表是可修改数据类型,不能做键{'h': 'hello', 0.5: [0.2, 0.3], 'w': 'world'}[0.2, 0.3]2.字典常用操作...
2021-04-11 14:26:34 125
原创 python字符串操作
1.字符串#字符串a='bus' \ 'ddd' #在第一行按了回车键,不能在第一行代码后注释print(a) #双引号和单引号一样b='''bus sss''' #也可以是三个双引号,三引号用于长段文字或说明,只要引号不结束,就可以任意换行print(b)busdddbus ssstips:*1.在pycharm中批量注释可以选中,按ctrl+?,取消也是一样的*2.批量缩进,选中,按tab键反缩进就按 shift+tab键## 标题
2021-04-10 21:47:18 84
原创 python中的列表
python中的列表一、列表构建及索引操作1.列表中的每个元素都是可变的2.列表中的元素是有序的,每个元素对应一个位置3.列表可以容纳python中的任何数据类型的对象列表的索引和切片演示二、列表元素的增删改查操作1.增加元素list.append() 从后面添加list.insert(index,p_object) 插入(新增元素会添加在下标前)2.删除元素list.remove()del list[0:2]3.修改元素list[index]=obje
2021-04-08 16:45:19 111
原创 第一个python程序
## 第一个python程序python中的变量不需要声明,每个变量在使用前都必须赋值,变量赋值以后该变量才会被创建。按住ctrl键,把鼠标放在想要查找的函数上,得到超链接,点击一下得到open函数的使用说明由此可见,open函数的第一个参数为file,即文件名称,mode为打开模式相关参数:r:以只读方式打开文件,文件的指针将会放在文件的开头。r+:打开一个文件用于读写,文件的指针将会放在文件的开头。w:打开一个文件只用于写入。如果该文件已存在则将其覆盖,如果该文件不存在,创建新文件。
2021-04-05 15:54:10 83
原创 CNN卷积神经网络
CNN卷积神经网络#标题一、定义## 标题卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一 。卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络”。卷积神经网络仿造生物的视知觉机制构建,可以进行监督学习和非监督学习,其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化特征,例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程要求。二、CNN 解决了什么问题?##
2021-02-02 00:50:33 1459
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人