基础
michael_wq
这个作者很懒,什么都没留下…
展开
-
map(mapping)技巧
先说数据集原创 2020-11-27 08:30:25 · 861 阅读 · 0 评论 -
dataframe中寻找一些字符串的方法
一般常用的有两个xxx.isin([‘a’, ‘b’])isin中的字符串要与columns里头的字符串完全匹配,才会返回True。不能只是一部分xxx…str.contains(’…’, na=False)contains只需要含有就可以,不需要完全一模一样,包含一部分就会返回True...原创 2020-11-26 08:17:31 · 2209 阅读 · 0 评论 -
阿里云天池-AI训练营机器学习TASK3 - KNN
KNN原理介绍k近邻方法是一种惰性学习算法,可以用于回归和分类,它的主要思想是投票机制,对于一个测试实例x, 我们在有标签的训练数据集上找到和最相近的k个数据,用他们的label进行投票,分类问题则进行表决投票,回归问题使用加权平均或者直接平均的方法。knn算法中我们最需要关注两个问题:k值的选择和距离的计算。kNN中的k是一个超参数,需要我们进行指定,一般情况下这个k和数据有很大关系,都是交叉验证进行选择,但是建议使用交叉验证的时候,k∈[2,20],使用交叉验证得到一个很好的k值。k值还可以表示我原创 2020-11-20 14:00:41 · 441 阅读 · 0 评论 -
python - seaborn sns
Q: 这个怎么搞用sns?可以用huesns.scatterplot(x, y, data=df, hue='smoker')plt.show()原创 2020-10-26 20:35:24 · 5696 阅读 · 0 评论 -
pandas Q&A
Q: 如何把DataFrame datetime转化成datetime格式,然后在把year,month,day提取出来?df['date'] = pd.to_datetime(df['date'], utc=True)df['year'] = df['date'].dt.yearQ: 找出倒数10个数据df.tail(10)Q: 如何查找是否又重复数据?然后去掉重复的数据?查找:df['location'].duplicated() # 返回的是bool,所以可以靠这个索引set原创 2020-10-23 13:49:18 · 105 阅读 · 0 评论 -
2020-10-21 pandas - tables关系
PandasQ: inner join用什么?# df1, df2df1.merge(df2, on='xxx', suffixes=('_aaa', '_bbb'))Q: 多个tables拼接如何?# df1, df2, df3df1.merge(df2, on=['xxx', 'yyy']) /.merge(df3, on='zzz', suffixes=(...))原创 2020-10-22 22:23:02 · 438 阅读 · 0 评论 -
TASK4_Python基础入门:Pokemon数据分析--阿里云天池
开始上手数据分析对于数据分析,我整体下来发现自己的基础还是不是很牢固,主要还是熟练的工作,要灵活运用一些python package,了解数据格式,知道怎么批量更改数据把一些错误的值改成统一的,这样处理下来才不会出错。希望自己以后可以坚持下来,慢慢把这个骨头啃下来,也欢迎可以和小伙伴们一块学习,共同进步!import pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltdf = pd.read_csv("./pokemo原创 2020-09-10 20:22:11 · 305 阅读 · 0 评论 -
TASK3_Python基础入门:从函数到高级魔法方法--阿里云天池
函数函数以def关键词开头,后接函数名和圆括号()。函数执行的代码以冒号起始,并且缩进。return [表达式] 结束函数,选择性地返回一个值给调用方。不带表达式的return相当于返回None。def functionname (parameters): “函数_文档字符串” function_suite return [exp原创 2020-09-09 13:55:24 · 216 阅读 · 0 评论 -
TASK2_Python基础入门:数据结构大汇总--阿里云天池
列表List多种方式创建列表#1x = ['Monday', 'Tuesday', 'Wednesday', 'Thursday', 'Friday']x = list(range(10, 1, -2))print(x, type(x))# [10, 8, 6, 4, 2] <class 'list'>x = [i for i in range(100) if (i % 2) != 0 and (i % 3) == 0]print(x, type(x))# [3, 9,原创 2020-09-08 16:58:00 · 243 阅读 · 0 评论 -
Python基础入门:从变量到异常处理--阿里云天池
最近报名参加了阿里云天池的python学习,希望在这里记录下自己的学习需要强化记忆的地方,方便以后可以随时复习,增强巩固自己的python技能。转载 2020-09-07 19:54:43 · 132 阅读 · 0 评论