- 博客(18)
- 收藏
- 关注
原创 Python学习打卡第十五天
每个数据集都会有很多差别,在对数据集进行机器学习建模等实践过程中,需要针对性的选择合适的方法和策略,并且在实践中调整,不断改进,这样才可以找出最合适的模型,使用合适的模型和最佳的参数,才能帮助我们充分利用计算机算力,完成更加精准的预测。@浙大疏锦行。
2025-05-05 00:31:05
245
原创 Python打卡学习第十三天
在处理数据不均衡时有很多方法可以使用,但也不是盲目的使用,要根据实际情况来确定使用哪种方法。具体策略如下:1.评估指标先行: 明确你的目标,使用适合不平衡数据的指标(Recall, F1-Score, AUC-PR, Balanced Accuracy, MCC)来评估模型。2.优先尝试根本方法: 通常建议首先尝试修改权重 (class_weight=‘balanced’) 或 数据采样方法 (如 SMOTE),因为它们试图从源头改善模型学习。
2025-05-02 23:01:51
983
原创 Python打卡学习第十二天
这三种算法各有优缺点:遗传算法适合处理复杂的搜索空间,能够找到全局最优解,但计算开销较大。粒子群优化简单易实现,收敛速度快,但可能陷入局部最优。模拟退火在处理大规模问题时表现良好,但参数设置(如初始温度、降温速率)对结果影响较大。今天的内容都是让ai大模型帮我生成的资料,在学习了这些资料后我对这些算法有了初步的了解,在实践应用方面我仍然缺乏,这需要在之后的学习中不断提高,非常期待在今后的学习和实践中使用这些算法,帮助我更好的寻找到最优的参数。@浙大疏锦行。
2025-05-02 00:01:36
853
原创 Python学习打卡第十一天
将之前有一次没及时打卡造成的空缺补上,因为感觉到不能被惰性所奴隶,一步松懈了,可能后面的每一步都会慢很多,最后导致欠缺不断积累,坚持不下去。再一次给自己敲响警钟,树立自觉学习的意识,不断坚持。@浙大疏锦行。
2025-05-01 01:30:02
213
原创 Python学习打卡第十天
虽然知道机器学习模型调用十分容易,但在尝试了许多不同的模型后,仍然感叹如今科技实力的强大,将这些模型制作的非常优秀,使后续的调用方便快捷,利于大家的学习和使用。@浙大疏锦行。
2025-04-30 23:46:03
325
原创 Python学习打卡第八天
标签编码适合有序类别,简单且内存占用少,但可能引入不必要的顺序关系。数值编码(如独热编码)适合无序类别,避免了顺序问题,但可能导致维度增加和计算复杂度上升。在选择编码方式时,需根据具体的应用场景和数据特征来决定使用哪种编码方法。在使用sklearn库中的fit_transform方法传入列名时,出现了报错,在查找了资料后发现了问题,原因是fit_transform方法期望的是一个二维数组或者DataFrame格式输入,而不是一维的数据。
2025-04-28 00:05:51
872
原创 Python学习打卡第七天
matplotlib库画图因为时间关系,先不做复习,一部分是没时间了,一部分是考虑到这部分内容刚学习,过两天之后再来复习,更加考验我的记忆力,更能让我明白自己的薄弱环节。查看一下每个列的属性,可以看到都是数值类型,比数值和其他离散信息混合的数据更加便于处理。查看各个列是否存在缺失值,可以发现没有缺失值,所以这个数据集比较适合新人练手,但为了锻炼自己还是敲了一遍填补缺失值的代码。之前学习的知识不光要用在某一个数据集中,今天换一个数据集进行练习,顺便巩固知识,温故而知新。查看一下列名和数据的属性。
2025-04-26 23:36:45
323
原创 Python学习打卡第六天
今天主要归纳了一下matplotlib库的用法,以及尝试了几种不同的图怎么使用,了解了不同图具有的特点。明天仍然需要对实践部分加强训练,因为对于这个库的使用还不太熟练,而这个库在数据分析中又是至关重要的一环,因此必须熟练操作,快速独立写出代码。@浙大疏锦行。
2025-04-26 00:03:36
263
原创 Python学习打卡第五天
在以上的实操练习中,years in current job(即在职年限)列不太适用该方法,最好使用数值编码。因为如下图所示,该列被分为十几种类型,造成大量的资源浪费。因此在后续的学习中,需要对该列的处理方式进行优化。这也提醒了我们,在数据预处理时一定要合理使用方法,不能随意套用,虽然可以运行成功,但是不够严谨,不是最优解。@浙大疏锦行。
2025-04-24 23:05:06
485
原创 Python学习打卡第三天
在写Python语言时总是下意识用C语言语法,这个缺点需要通过多加练习,逐渐摒弃,要在做到可以在各种语言之间切换自如。@浙大疏锦行。
2025-04-22 23:24:19
1036
原创 Python学习打卡第二天
题目: 定义两个字符串变量,str1 赋值为 “Hello”,str2 赋值为 “Python”。将这两个字符串拼接起来(中间加一个空格),并将结果存储在变量 greeting 中;计算 greeting 字符串的长度,存储在变量 length 中;获取 greeting 字符串的第一个字符,存储在变量 first_char 中。
2025-04-21 23:30:44
351
原创 总结介绍C语言分支语句和循环语句
在近期 C 语言的学习中,我愈加地发现分支语句和循环语句在编程中的扮演着十分重要的角色,是实现整个程序逻辑结构的核心部分。计算机只能存储二进制数,也就是 0 或 1 ,计算机进行逻辑判断时,一般会把 0 认定为假,把 1 认定为真。而在 c 语言中,把 0 认定为假,把非零值认定为真,在对关系表达式进行处理判断之后如果为真则返回值为 1 ,如果为假则返回值为 0。在学习 C 语言的过程中,分支和循环结构是至关重要的一部分,它能够让程序高效地处理各种逻辑问题和重复任务。
2025-01-23 08:00:00
1307
原创 使用c语言解决进制转换问题
以上的代码其实也存在着一定的局限性,如在需要输入一个超过了int类型甚至超过了long long类型数据存储范围的整型数据时,或者两个都是非十进制的进制互相转换时,以上的算法仍然需要改进之后才可以成功解决问题。比如将一个长度数十位甚至上百位的十进制整数转换为二进制数输出,此时需要借助字符类型数组将这个大数进行存储,然后将每位数都视为字符进行处理;
2025-01-16 01:44:46
527
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人