pandas常遇到的问题和基础语句
在用pandas对arff格式的数据集进行数据预处理时,遇到了许多问题。写下这个博客是为了记录自己在使用pandas遇到的一些问题,对搜寻的解决方法进行归纳,方便以后查阅或是为出现其他人出现同样问题时提供解决路径。
利用pandas将arff转csv文件
链接1
https://blog.csdn.net/xzfreewind/article/details/79587726
链接2
https://www.jianshu.com/p/f1138475d052
转mat文件:
https://blog.csdn.net/geng333abc/article/details/80200179
利用python读取csv文件
链接1
https://www.cnblogs.com/cloud-ken/p/8432999.html
链接2
https://www.cnblogs.com/wqpkita/p/7285418.html
python常用语句
find()方法:
str.find(str, beg=0, end=len(string))
描述:Python find() 方法检测字符串中是否包含子字符串 str ,如果指定 beg(开始) 和 end(结束) 范围,则检查是否包含在指定范围内,如果包含子字符串返回开始的索引值,否则返回-1。
链接1:
http://www.runoob.com/python/att-string-find.html
python中axis=0 axis=1的理解:
https://blog.csdn.net/jiaxinhong/article/details/81772392
pandas之values和value_count()用法:
https://blog.csdn.net/zhuzuwei/article/details/80429209
常用函数:
https://blog.csdn.net/qq_18888869/article/details/83993002
利用pandas进行缺失值处理
处理思想链接:
https://blog.csdn.net/xzfreewind/article/details/77001293
处理方法链接:
https://www.jianshu.com/p/79086fa52803
https://www.cnblogs.com/creazylinux/p/7920170.html
https://blog.csdn.net/lwgkzl/article/details/80948548
https://blog.csdn.net/pipisorry/article/details/39482861
https://blog.csdn.net/weixin_38168620/article/details/79596819
https://blog.csdn.net/weixin_38490102/article/details/78867108
找到缺失值的位置:
https://www.jb51.net/article/138157.htm
https://blog.csdn.net/u012387178/article/details/52571725
利用python判断变量的属性
https://blog.csdn.net/weixin_34101229/article/details/85938165
pandas进行属性转换
dataframe的基本属性:
https://www.cnblogs.com/wodexk/p/10315582.html
链接:
https://blog.csdn.net/chenpe32cp/article/details/75452592
http://www.cnblogs.com/onemorepoint/p/9404753.html
https://blog.csdn.net/python_ai_road/article/details/81158376
pd.DataFrame(dtype= float):
https://blog.csdn.net/The_Time_Runner/article/details/88952609
用pandas进行数据替换
链接:
https://blog.csdn.net/print_and_return/article/details/80594205
利用pandas进行数据拼接与直连
https://www.jianshu.com/p/b437ecff123d
https://www.cnblogs.com/HixiaoDi/p/7739863.html