- 博客(26)
- 收藏
- 关注
原创 逻辑回归调优三板斧:参数调整、阈值设定、数据集平衡
在上一篇博客中我们建立的逻辑回归模型解决了银行贷款的二分类问题,但是不知道大家有没有注意到我们当时的召回率是非常低的,只有百分之百,这一次,我们就来学习如何进行逻辑回归的调优。
2025-12-15 21:32:38
760
1
原创 逻辑回归核心原理与实践指南
逻辑回归是“线性模型+分类激活函数”的经典组合,核心是用sigmoid函数将线性输出转化为概率,用极大似然估计定义损失,用梯度下降求解最优参数。实际使用中,要根据“是否漏检优先”(选高召回率)还是“是否误判优先”(选高精确率)来调整模型,并用sklearn快速落地,重点关注正则化参数(penalty、C)以防止过拟合。
2025-12-12 17:18:48
1129
原创 机器学习算法二:逻辑回归
今天继续进行机器学习算法的学习,在上一篇博客中我们介绍了knn算法和线性回归。逻辑回归其实是在线性回归的基础上演变出来的。
2025-12-12 00:51:33
1247
原创 网络爬虫(第二部)
1、 selenium是什么?用于Web应用程序测试的工具。可以驱动浏览器执行特定操作,自动按照脚本代码做出点击,输入,打开,验证等操作,就像真实用户所做的一样。支持的浏览器包括IE,Firefox,Safari,edge,Chrome等。2、 与requests库的区别?selenium库是基于浏览器的驱动程序来驱动浏览器执行操作的,且浏览器可以实现网页源代码的渲染,因此通过selenium库还可以轻松获取网页中渲染后的数据信息3、selenium的工作原理。
2025-12-10 00:21:13
1186
原创 机器学习预备知识:numpy、pandas、matplotlib库
正式开启机器学习的学习之前,我们需要掌握numpy(处理矩阵的库),panda(处理表盒的库)
2025-12-08 00:16:13
321
1
原创 navicat连接数据库&mysql常见语句及操作
navicat是操纵数据库的图形化工具,因为MySQL窗口是像命令行一样只有一个黑色的窗口,在navicat中进行操作会更加直观、可视化。xftp8是用于在不同系统中轻松传输文件的软件,我们这里实现Windows系统中的文件直接“拖”到centos中。软件下载兄弟们直接搜一下就行。
2025-12-05 23:40:01
523
原创 mysql安装配置及navicat远程连接
今天给大家带来数据库相关知识的学习。数据库是结构化存储容器,有点像表格,有主键,sql是管理这种特殊数据结构的语言,mysql则是基于sql语言管理数据库的工具。navicat则是图形化工具,帮助我们在可视化窗口下管理数据库,而不用完全基于mysql的命令行窗口。作为开发人员,我们学习一个新的东西首先要做的就是软件的安装和环境的配置,接下来带大家安装配置mysql。
2025-12-05 21:17:59
622
原创 操作文件夹及机器学习预备知识
今天来介绍python如何操作文件夹以及为机器学习做准备的一些库numpy、panda(矩阵,表格相关)。这一篇博客算是python基础知识的结束,也算是下一个部分知识机器学习的开端。也简单总结一下我们这两周学习的内容:1、python:从软件安装,环境部署开始,到python基本知识(数据类型、变量命名规则等)到程序控制语句(循环,判断等),到后面学习函数,类,库的知识,这三个是层层升级,封装的越来越好用的工具。
2025-12-04 22:04:30
875
原创 基于python的网络爬虫
以ua伪装为例:ua即urser agent(用户代理):指客户端(如浏览器、手机 App、爬虫程序)向服务器发送请求时,附带的一段 “身份标识字符串”,用于告诉服务器 “我是什么设备 / 程序”。如下图,ua伪装通过获取网页内容时添加头文件中ua的伪装实现反反爬。伪装身份在哪里找:以获取浏览器访问百度的ua为例:浏览器打开百度,鼠标右击选择检查 ,选择网络,选择第一项双击进入,刚进来不会显示ua需要刷新网页,最后一行就是ua,复制就行。
2025-12-02 21:32:26
1270
原创 操作html网页(网络爬虫预备知识)
1、域名和IP的关系:IP 是服务器/设备在互联网中的 “唯一地址标识”(类似身份证号),域名是为了方便人类记忆的 “别名”(类似手机号备注),本质上访问网页的核心是 “找到 IP 对应的服务器”,域名只是简化了这个过程。比如一个 IP 可以绑定多个域名(共享主机),但一个域名(不含子域名)通常只指向一个 IP(或多个 IP 做负载均衡)。1、打开视频网页,推荐凤凰网,因为很多平台都设置了限制,不让你轻松获取平台的资源。它通过标签(tags)定义网页的结构和内容,浏览器解析这些标签后渲染出可视化页面。
2025-12-02 16:20:46
1329
原创 jieba分词库
今天我们以jieba库为例,学习如何分析库,如何快速掌握库的使用方法。jieba库可用于把中文的一段话分解成基本的单词。原理是库中建立了词典,分词的过程就是将文字的所有内容与词典进行匹配,匹配成功就得到一个单词。中华文化博大精深,一句话有不同的分解方式,可能会产生不同的分解结果,因此jieba库设置了最优化算法,会按照概率最大的可能去分解单词,即便如此,依然可能产生分解错误的情况。
2025-12-01 20:51:41
805
原创 基于pyinstaller实现打包游戏成.exe文件
今天介绍我们学习过程中安装的第一个第三方库Pyinstaller。其使用方法实在命令行窗口或者终端执行命令,以实现相应的操作或功能。pip工具的常用命令:pip install 库名==版本号 -i 镜像地址 #安装第三方库,注意版本很重要pip uninstall 库名 #卸载第三方库pip list #查看安装的库。
2025-12-01 14:09:51
526
原创 python中的库
今天来带大家学习库的知识,库相当于python的仓库,在代码中使用库的工具可以实现更多功能。python库分为标准库和第三方库,其中标准库是python自带的库,在安装python时会自动将标准库安装到计算机中。第三方库是由第三方机构开发的库,并不是python官方提供的库,因此用户在使用前需要自行下载。
2025-11-30 20:21:39
948
原创 操作文件:python办公自动化入门
其实我写博客的时候发现,这里我们没必要把时间转化为分钟,直接基于小时的信息就可以判断,因为我们的时间分割节点都是整小时,没必要去考虑分钟的情况,比如只要小时在1到3点,时辰信息牛,就是读者可以尝试一下。这里代码是综合性比较强的,基本上把我们前面学的知识点都用到了,大家可以看一遍思路,然后一定要自己亲手敲一遍,我们以后做开发,需要具备这种基本的代码能力,能够独立完成这段代码就具备了比较扎实的基本功。我们打开的文件中如果有中文的内容,就需要选择utf-8的编码方式。返回的内容会在会在行尾自带一个换行符\n。
2025-11-27 21:17:39
1268
原创 Shell编程入门:从零掌握Linux自动化
在shell语言中,只用两种变量类型,字符串和数值。shell语言中定义变量不需要声明变量类型,直接赋值即可(脚本语言往往如此)。变量的命名规则与大多数编程语言一样(老生常谈)。需要注意的是,在shell语言中“=”的周围不能有空格。三种方式的区别:例子:不加引号的方式,不保留空格,也会是说赋值到空格,变量就定义结束了,后面的语句就会报错:这里的$符号表示返回变量的值,若是直接echo a,就会直接打印字母a。这里就是前面提到变量的三种定义方式,前面说的变量就是指字符串。
2025-11-26 20:10:19
1441
原创 python中的类(面向对象程序设计)
就像是函数是实现某种特定功能的小工具,我们可以通过调用函数实现特定功能而不需要每次都重新写一遍实现这个功能的代码。类可以理解成函数的升级版,类里面可以包含多个函数,准确一些描述,可以把类理解成一个系统,比如微波炉的系统(包括加热,定时等操作),我们可以把这些功能,以及里面包含各种数据(属性)和操作(函数)封装成一个整体。这样我们在给新的微波炉安装系统时,只需要把封装好的类当作模板,导入新的微波炉即可。类理解成模板,而对象,就是基于模板创建的微波炉中的实际系统,是实例。
2025-11-24 23:59:50
215
原创 Linux简介、基本功能、基础指令
不同于我们常用的Windows系统,Linux是市面上占有率极高的服务器操作系统,大多数企业的服务器都是使用Linux。Linux有很多版本,我们在前面一篇安装的是centos的版本。
2025-11-21 20:39:14
503
原创 python基础知识罗列(“我痞吗”版)
while true无限循环,因为超市系统确实一直在运行(除非关机)。4、break结束循环,continue进入下一轮循环。项目案例:白菜价格计算系统(买的越多,白菜的折扣越多)列表和字符串一样,可以进行索引和切片。注意返回值是一个列表。
2025-11-20 20:56:30
84
原创 Xshell远程连接centos7,linux常用指令(补充IP地址相关知识版)
vmnet1是仅主机模式,我们的虚拟机只能与主机连接,不能连接外部网络;实际上,我们刚才的连接方式是使用的是虚拟机的动态IP,此时虚拟机的IP是由VMware动态分配的,因此我们下次登录的时候,需要重新在xshell的会话属性中更改IP地址。8、这时,我们xshell的连接会断,因为IP地址变了,我们可以:文件-->打开—>右键虚拟机选择属性,更改成刚刚设置的IP重新连接就行。IP是设备在网络中的唯一标识,这里使用的IP4(未来会被IP6取代),IP由四段组成,用.分隔,每一段的范围是0~255。
2025-11-19 11:59:12
624
原创 零基础Linux入门(保姆级教程):VMware workstation16 pro、Xshell8和centos7的下载、安装及使用
centos7是Linux系统的一个特定版本。一台电脑正常情况下只能装一个操作系统,因此我们需要虚拟电脑软件VMware workstation pro(全球知名的专业虚拟机软件)创建虚拟机,在虚拟机中安装Linux系统。Xshell则是专业的终端模拟工具,使得我们不用在 VMware 的虚拟机窗口里操作 CentOS(窗口小、复制粘贴麻烦),而是在 Xshell 里用更舒适的终端界面,并且能够同时管理多台虚拟机,效率高很多。
2025-11-18 21:27:00
684
原创 零基础python入门:python与pycharm的下载、安装及使用
本文介绍了Python编程语言及其开发工具PyCharm的基本使用方法。首先说明了Python作为编程语言的作用,对比了Python自带的IDLE和功能更完善的PyCharm开发环境。详细讲解了Python 3.7.9版本的下载安装步骤,包括官网和国内镜像站两种途径,并介绍了安装后的验证方法。随后阐述了PyCharm的下载安装过程,重点说明了社区版的选择和基本配置。在使用方面,介绍了PyCharm的汉化方法、项目创建流程和环境配置要点。最后概括了Python编程基础知识点,包括print函数、变量命名规则、
2025-11-17 20:10:52
1203
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅