文章目录
-
- 豆瓣、清华源命令
- pip升级命令
- 画图plot汉字显示不出
- python控制台打印结果省略的问题
- enumerate()
- pandas描述数据基本分布情况
- isin():判断值是否存在
- 某两个特征之间的关联性:np.corrcoef
- for循环缩写
- 计算每一个特征和标签之间的相关程度
- pd.DataFrame()创建
- 盒图:sns.boxplot() 一般用于离散特征(0,1分布)
- map(lambda x)
- loc:根据条件填充数据
- corr:计算两两特征之间的关系
- concat():合并csv文件
- 读取csv的默认索引:index_col
- str.contains():查看是否包含某个字符串
- resample():专用于处理时间序列
- sort_values():进行排序
- 数据条件筛选:挑选出表格中满足两个或者多个条件的数据
- 处理时间序列
- groupby()函数:对每周的数据进行统计
- 填充缺失值
- 为什么需要做特征工程
- 模型评判标准/函数
- target编码
- 内存回收
- apply(lambda:x)
- sklearn.preprocessing():进行函数缩放
- 找出异常值,进行处理
- 特征划分区间
- 进行特征选择一些方法
- 画ROC曲线
- 训练模型如何把验证集加进去,并查看特征重要度``
- 缺失值查找
- 空值查找
- 删除数据集中数据
- 按照一定比例划分训练集和测试集
- np.ravel()将多维数组转换为一维数组的功能
- set_index()用来改变索引值,注意需要加一个参数 `replace = True` 表示替代
- 返回数据的列名
- dtypes: 返回各列的数据类型
- 对数据按照某一列进行排序
- python字典中查找值中包含指定字符串的键
- 利用pandas向一个csv文件追加写入数据
- drop_duplicates():删除重复项
- list列表删除
- 修改列名
- 计算众数、中位数、平均值、极值、标准差等统计量
- 多列拼接到一列
- DataFrame固定位置插入列
- DataFrame添加行数据
- 两个Dataframe进行合并,追加新内容在行尾
- 根据现有列添加一列
- DataFrame读取某列、某行数据:loc()、iloc()
- 统计某一列或某一行的缺失值
- 统计某一列中各个值的出现次数
- Color颜色选取
- 合并两个list
- list列表中最大(最小)的几个值以及索引
- 计算两个list之间的差集和并集
- missingno():缺失值可视化
- str.cat():多列拼接成一列函数
- 画图
- 三目运算符
- DataFrame替换列中的值
- DataFrame筛选控制数据
- 删除csv行/列数据
- csv中插入行数据
- 对多个条件进行筛选/多条件筛选
- 多列合并为一列
- 计算某列最大值出现的位置索引
豆瓣、清华源命令
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple cryptography
或者
pip install pyautogui -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.