机器学习实训

本文探讨了数据处理中的关键技巧,包括数据合并(merge)、列类型转换(astype)、列关联(join)和数据合并(combine_first)。重点讲解了如何处理重复值(duplicated)以及消除索引中的重复项。此外,还提到了防止中文编码问题的方法,并在MySQL中导入数据的注意事项。同时,文章提及了在数据分析中进行布尔索引和自定义函数进行矢量化运算的实践应用。
摘要由CSDN通过智能技术生成

 

1.merge:列的类型要一样:

.astype("str")

2.join:

(连列名都得一样才能关联)

3.conbine_first(数据合并)使两列的空值减少

4.把索引干掉,有重复值

5.duplicated()标记为false没有重复(布尔索引)

6.判断字符重复自己写一个equse函数,来判断,矢量化运算。

7.防止中文编码有问题:

mysql -u root -p --default-character-set=utf8 

use dbname 

source /root/newsdata.sql

8.mysql8与Navicat8连接不上的操作:

9.axis=0:

axis=1:针对于每一行(反了)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值