闲客散人-CSDN博客

原创机器学习入门（3）

一种基于实例的学习模型，通过计算样本与训练集中的其他样本之间的距离来进行分类。：一种基于贝叶斯定理的概率模型，假设特征之间是相互独立的。可以看到，代价函数 J(a, b) 是关于模型参数 a 和 b 的函数，它的值越小，说明模型的预测结果越。其中，h(x,a, b) = a*x + b 是模型预测的值，y 是实际的目标值，m 是样本数量。在不同的机器学习算法中对应着不同的代价函数和损失函数，例如线性回归的代价函数是均方误。：一种集成学习模型，由多个决策树组成，最终的预测结果由多个决策树的结果投票决定。

2023-09-25 18:15:58 81

原创机器学习入门（2）

无监督学习（Unsupervised Learning）作为一种机器学习技术，其主要目标是利用未标记的数据，通过学习数据的内在结构和规律，发现数据的潜在特征和类别。在无监督学习中，模型从未标记的数据中学习出数据的分布规律和结构，例如聚类、降维、特征提取等。这些方法在没有标签的情况下，通过探索数据的内在特征和模式来发现数据的潜在类别或结构。线性回归是利用数理统计中的回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种。

2023-09-25 18:00:42 62

原创机器学习入门（1）

监督学习（Supervised Learning）是指从标注数据中学习预测模型的机器学习问题。标注数据表示输入（input）输出（output）的对应关系，预测模型对给定的输入产生相应的输出。监督学习的本质是学习输入到输出的映射的统计规律。

2023-09-25 17:41:32 93

原创 python实战学习6——爬虫

该网站运用了一个全新的反扒手段：隐藏域——hidden*(隐藏域数据即在源码中可以找到的，但是不会在网页页面中显示的数据)相比于之前的cookie登陆，本节还由通过验证码登陆的功能。这里以古诗词网的登陆页面为例。

2023-07-31 21:02:32 592

原创 python实战学习5——爬虫

扩展:某大学FTP(前提是该代理地址在该资源的允许访问范围之内)，使用教育网内地址段免费代理。扩展:通常代理服务器都设置一个较大的硬盘缓冲区，当有外界的信息通过时，同时也将其保存到。区中，当其他用户再访问相同的信息时，则直接由缓冲区中取出信息，传给用户，以提高访问速。服务器，就可以用于对教育网开放的各类FTP下载上传，以及各类资料查询共享等服务。用handler对象创建opener对象使用opener.open函数发送请求。（6）利用proxies变量存放的ip代理来访问url相应的网页。

2023-07-31 20:58:14 566

原创 python实战学习4——爬虫

（2）请求头有很多种数据信息（比如ua代理，cookie，referer...）但是请求成功所需求的信息可。（3）请求头中referer的作用：防盗链，判断当前路径是否是由上个路径进来的，如果不是则报。像微博这样的个人信息页面是utf—8，但是在数据采集时仍然报错，是因为没有进入到个人信息页。面，而是跳转到了登陆页面，那么登陆页面不是utf—8，因此报错，而是gb2312。适用场景：数据采集的过程中，需要绕过登入，进入某个界面。（1）为什么访问不成功？答：一般因为请求头的信息不够。第一步：请求对象的定制。

2023-07-31 20:20:48 561

原创 python实战学习3——爬虫

用type方法可以发现打印出来的content是str类型，实际上content是json类型，因此必须通过json方法来将content翻译为可以读懂的类型，因此还要加上下面的内容。

2023-07-23 23:35:03 522

原创 python实战学习2——爬虫

以以下网址为例解析url的组成：一个完整的url由协议，主机，端口号，路径，参数，锚点六部分组成（如下图）

2023-07-23 23:26:40 830

原创 python实战学习1——爬虫

网络爬虫是一种自动化程序，用于浏览互联网并收集网页上的信息。它们使用特定的算法来跟踪链接，访问网页，并提取有用的数据。网络爬虫通常被用于搜索引擎、数据挖掘、价格比较、内容聚合等领域。它们可以帮助我们快速获取大量的数据，并进行进一步的分析和处理。

2023-07-23 23:14:37 1320

原创 python学习笔记week7（3）

（1）什么是复写？子类继承父类的成员属性和成员方法后，如果对其“不满意”，那么可以进行复写。即:在子类中重新定义同名的属性或方法即可。（3）一旦复写父类成员，那么类对象调用成员的时候，就会调用复写后的新成员如果需要使用被复写的父类的成员，需要特殊的调用方式:方式1:调用父类成员使用成员变量:父类名.成员变量使用成员方法:父类名.成员方法(self)方式2:使用super()调用父类成员使用成员变量: super().成员变量使用成员方法: super().成员方法。

2023-07-17 00:24:30 50

原创 python学习笔记week7（2）

（3）多继承：Python的类之间也支持多继承，即一个类，可以继承多个父类。继承就是一个类，继承另外一个类的成员变量和成员方法。class类名(父类名)∶。

2023-07-17 00:15:50 63 1

原创 python学习笔记week7（1）

私有成员变量:变量名以_开头（2个下划线)，私有成员方法:方法名以__开头（2个下划线)即可完成。（2）前边有提到过面向对象编程，是许多编程语言都支持的一种编程思想，简单理解是:基于模板。其中，封装表示的是，将现实世界事物的:·属性，行为。（3）私有成员：类中提供了私有成员的形式来支持。（类）去创建实体（对象），使用对象完成功能开发。成员变量和成员方法的命名均以__作为开头即可。（4）什么是私有成员?封装到类中，描述为:成员变量，成员方法。类中的其它成员可以访问私有成员。即私有成员变量，私有成员方法。

2023-07-17 00:06:51 35 1

原创 python学习笔记week6（3）

可以看到，在方法定义的参数列表中，有一个: self关键字，self关键字是成员方法定义的时候，必。·当我们使用类对象调用方法的是，self会自动被python传入。类也可以包含属性和行为，所以使用类描述现实世界事物是非常合适的。·构建类对象的传参会传递给构造方法，借此特性可以给成员变量赋值。·在方法内部，想要访问类的成员变量，必须使用self。·只有通过self，成员方法才能访问类的成员变量。·它用来表示类对象自身的意思。·构建类对象的时候会自动运行。2.类和对象的关系是什么?·表示类对象本身的意思。

2023-07-10 00:11:15 36 1

原创 python学习笔记week6（2）

其中:类中定义的属性（变量)，我们称之为:成员变量，类中定义的行为（函数），我们称之为:成。（1）在程序中是可以做到和生活中那样，设计表格、生产表格、填写表格的组织形式的。1.生活中或是程序中，我们都可以使用设计表格、生产表格、填写表格的形式组织数据。·设计表格，称之为:设计类（class)·打印表格，称之为:创建对象。·类的行为，即定义在类中的函数（成员方法)1.在程序中设计表格，我们称之为∶设计类(class)3.在程序中填写表格，我们称之为:对象属性赋值。·类的属性，即定义在类中的变量（成员变量)

2023-07-10 00:03:54 59 1

原创 python学习笔记week6（1）

Echarts框架的Python版本:PyEcharts包。3.如何查看官方示例。

2023-07-09 23:58:21 61 1

原创 python学习笔记week5（3）

（1）第三方包：在Python程序的生态中，有许多非常多的第三方包(非Python官方)，可以极大的帮助我们提高开发效率，如;·科学计算中常用的: numpy包·数据分析中常用的: pandas包·大数据计算中常用的: pyspark、apache-flink包·图形可视化常用的:matplotlib、pyecharts。人工智能常用的: tensorflow这些第三方的包，极大的丰富了Python的生态，提高了开发效率。

2023-07-03 00:17:16 41 1

原创 python学习笔记week5（2）

从物理上看，包就是一个文件夹，在该文件夹下包含了一个_init_.py 文件，该文件夹可用于包含多。如果Python的模块太多了，就可能造成一定的混乱，这时就可以通过Python包的功能来管理。（1）包：基于Python模块，我们可以在编写代码的时候，导入许多外部代码来丰富功能。注意:必须在`_init_.py`文件中添加`_all_ = []`，控制允许导入的模块列表。创建包会默认自动创建的文件，通过这个文件来表示一个文件夹是Python的包，而非普通的文件。个模块文件从逻辑上看，包的本质依然是模块。

2023-07-03 00:05:34 50 1

原创 python学习笔记week5（1）

如果一个模块文件中有`_all_`变量，当使用` from xxx import *`导入时，只能导入这个列表中的元。Python模块(Module)，是一个 Python文件，以.py结尾.模块能定义函数，类和变量，模块里也能包。总之:模块就是一个Python文件，里面有类、函数、变量等，我们可以拿过来用（导入模块去使用)（4）测试模块：在实际开发中，当一个开发人员编写完一个模块后，为了让模块能够在项目中达。模块的作用: python中有很多各种不同的模块，每一个模块都可以帮助我。

2023-07-02 23:53:41 35 1

原创 python学习笔记week4（3）

前进后退右转左转前往/定位设置x坐标设置y坐标设置朝向返回原点画圆画点印章速度画笔落下画笔抬起画笔粗细画笔画笔是否落下（3）颜色控制颜色画笔颜色填充颜色（4）窗口控制背景颜色背景图片屏幕大小。

2023-06-18 22:54:20 45

原创 python学习笔记week4（2）

（9）c++中&与&&的区别:前者是按位与(按位运算符)处理的是地址(10101010101011010)二进制位数，而后者逻辑与(逻辑运算符)处理的是条件。而Python中&是位与(为运算符)，和c++的&基本一样，但是逻辑运算符不再是&&，||而分别是and，or，not了(作用和上边的逻辑运算符一样)（1）既然input传递给变量的数据类型一定是字符串型，那么直接赋值(如a＝1，b＝1.222222，c。（4）Python的特点:简单，开源，面相对象，多平台兼容性，可移植性。

2023-06-18 22:45:17 50

原创 python学习笔记week4（1）

dict = {’num2’’30’,’num1’:’20’}（1）冒号在python中最常见的作用就是作为一个语法结构，也就是if。（4）冒号在Python的作用:（1）冒号在python中最常见的作用就是作为一个语法结构，也就是if条件判。（2）而冒号的另外作用就是为切片时的连接符号来使用了，在对一个有序序列通过切片方式获取。使用一个冒号来表示下一行回车之后的代码不是逻辑行的结束，而是该结构代码块的开始，示例如。个冒号来表示下一行回车之后的代码不是逻辑行的结束，而是该结构代码块的开始，示例如下所。

2023-06-18 22:39:08 62 1

原创 python学习笔记week3（3）

基本语法:try:print(''name变量名称未定义错误'')注意事项①如果尝试执行的代码的异常类型和要捕获的异常类型不一致，则无法捕获异常。②一般try下方只放一行尝试执行的代码。当捕获多个异常时，可以把要捕获的异常类型的名字，放到except后,并使用元组的方式进行书写。try:print(1/0)print('zeroDivision错误...')else表示的是如果没有异常要执行的代码。

2023-06-11 20:23:57 51 1

原创 python学习笔记week3（2）

案例演示:1.打开文件2.文件写入3.内容刷新f.flush()注意:直接调用write，内容并未真正写入文件，而是会积攒在程序的内存中，称之为缓冲区，当调用flush的时候，内容会真正写入文件，这样做是避免频繁的操作硬盘，导致效率下降（攒一堆，一次性写磁盘）w模式，文件不存在，会创建新文件，w模式，文件存在，会清空原有内容close()方法带有flush()方法的功能。

2023-06-11 20:00:48 56 1

原创 python学习笔记week3（1）

﹒关键字不定长传递以**号标记一个形式参数，以字典的形式接受参数，形式参数一般命名为kwargs。﹒位置不定长传递以*号标记一个形式参数，以元组的形式接受参数，形式参数一般命名为args。·通过“键=值”形式传递参数,可以不限参数顺序﹒可以和位置参数混用，位置参数需在前。函数作为参数传递和一般的参数传入的区别：传入的是计算逻辑，而非计算数据。·匿名函数的定义中，函数体只能写一行代码，如果函数体要写多行。代码，不可用lambda匿名函数，应使用def定义带名函数。·根据参数位置来传递参数。

2023-06-11 19:19:03 63 1

原创 python学习笔记week2（3）

（1）集合的定义：基本语法:#定义集合字面量{元素，元素,......，元素}#定义集合变量变量名称={元素，元素，......，元素]#定义空集合变量名称= set（）（2）集合的特点可以容纳多个数据可以容纳不同类型的数据（混装)数据是无序存储的（不支持下标索引)不允许重复数据存在可以修改（增加或删除元素等)·支持for循环（3）如何遍历集合元素·可以使用for循环进行变量·不可以使用while循环，因为不支持下标索引（4）关于集合的基本操作：集合.add(元素)

2023-06-04 00:11:44 56 1

原创 python学习笔记week2（2）

（1）question：字符串为什么被称之为数据容器A:字符串可以看做是字符的容器，支持下标索引等特性（2）字符串的特点：·只可以存储字符串·长度任意(取决于内存大小)·支持下标索引·允许重复字符串存在·不可以修改（增加或删除元素等）·支持for循环（3）字符串的常规操作：字符串[下标]根据下标索引取出特定位置字符字符串.index(字符串)查找给定字符的第一个匹配项的下标将字符串内的全部字符串替换为字字符串.replace(字符串1,字符串2)字符串.split(字符串)

2023-06-04 00:01:21 30 1

原创 python学习笔记week2（1）

（1）元组定义:定义元组使用小括号，且使用逗号隔开各个数据，数据可以是不同的数据类型。所以，当我们需要在程序内封装数据，又不希望封装的数据被篡改，那么元组就非常合适了。可以容纳不同类型的数据（混装)。数据是有序存储的（下标索引)。元组同列表一样，都是可以封装多个、不同类型的元素在内。思考:列表是可以修改的，如果想要传递的信息，不被篡改，列表就不合适了。查找某个数据，如果数据存在返回对应的下标，否则报错。变量名称=(元素，元素，......，元素)(元素,元素，......，元素)统计元组内的元素个数。

2023-06-03 23:53:54 32

m0_73631277的博客