- 博客(8)
- 收藏
- 关注
原创 wonderful sql day4 初识数据库
DBMS 主要通过数据的保存格式(数据库的种类)来进行分类,根据数据库种类分别:层次数据库(Hierarchical Database,HDB)关系数据库(Relational Database,RDB)RDBMS 最常见的系统结构就是客户端 / 服务器类型(C/S类型)。
2023-07-24 00:12:28
147
原创 吃瓜教程day01 机器学习(周志华)Chapter1~2
自助法Bootstrap:有放回抽样地抽取训练记录(63.2%),没抽中的记录作为检验集的一部分,重复以上过程b次,得到b个自主样本。交叉验证cross-validation:假设把数据分为相同大小的k个子集,选择一个子集作为验证集,其他子集作为训练集,该过程重复k次,使每份数据都用于检验恰好一次。没有免费的午餐定理(NFL定理):前提是所有问题出现的机会等同、或者所有问题同等重要(假设f均匀分布),此定理寓意是:脱离具体问题而空泛谈论哪个算法更好是毫无意义的。训练误差/经验误差:学习器在训练集上的误差。
2023-07-22 01:15:08
187
原创 数据挖掘导论 Chapter4 读书笔记
在极度不平衡的数据下(Positive的样本较少),PR曲线可能比ROC曲线更实用。:是以假正率(FP_rate)和假负率(TP_rate)为轴的曲线,如L1和L2。= TN/N,表示的是所有负例中被分对的比例,衡量了分类器对负例的识别能力。= TP/P,表示的是所有正例中被分对的比例,衡量了分类器对正例的识别能力。= (FP+FN)/(TP+TN+FP+FN),与ACC是互斥事件。= TP/(TP+FP),即被分为正例的示例中实际为正例的比例。:分类器训练和预测需要的时间。:处理缺失值和异常值的能力。
2023-07-22 00:49:07
192
原创 数据挖掘导论 Chapter1~2读书笔记
数据挖掘是数据库中知识发现的一部分。知识发现KDD是将未加工的数据转换为有用信息的整个过程,包括输入数据、数据预处理、数据挖掘、数据后处理、输出信息。
2023-07-22 00:45:18
203
原创 wonderful-sql day01 环境搭建、初识数据库
一些感想:一直想学习sql,但是不知道怎么开始学,总是卡在第一步环境搭建上。之前也有接触过一些sql的基本语法,了解句式,但是因为环境搭建的问题一直没有实践的机会。本次学习的目的是为了掌握sql语句并熟练运用(企业更常使用sql,对于找工作实习都很有帮助),也是为以后往数据分析岗发展做准备。本次学习在此平台记录遇到的问题和解决方案,记录经典案例,以备未来复习所用。
2023-07-21 01:53:01
167
1
转载 AI 夏令营机器学习 day01 深度学习环境配置问题
使用搜索很容易查找到nvidia-smi.exe的路径为:C:\Program Files\NVIDIA Corporation\NVSMI。再重新打开cmd或者WindowsPowerShell,运行nvidia-smi,成功解决问题!错误:无法将“nvidia-smi”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。
2023-07-20 23:41:09
772
1
原创 常见python报错整理
在如上代码中,由于变量list和函数list重名了,所以函数在使用list函数时,发现list是一个定义好的列表,而列表是不能被调用的,因此抛出一个类型错误。callable()是python的内置函数,用来检查对象是否可被调用,可被调用指的是对象能否使用()括号的方法调用,类似于iterable()'int' object has no attribute 'startwith':函数使用的数据格式错误。
2023-07-14 01:34:50
494
原创 pycharm找不到目录 [Errno 2] No such file or directory
解决方法:核查默认目录与所放文件的目录是否一致,若不一致则重新创建新的folder。
2023-07-11 18:04:03
2713
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人