python学习
christineNAN
路遥知马力,日久见人心~
展开
-
python导入安装包之使用国内镜像安装
此处以安装scipy,statsmodels包的时候一直超时失败报错为例:直接使用 pip install scipypip install statsmodels由于网络原因可能会超时,导致一直安装不上,之前提到可以到到官网找到安装包,使用迅雷加速下载.wheel文件安装,然后使用命令安装。或者到github下载源码进行安装 [源码安装]除了上述提到的两种方法,还可以使用国内镜像文件安装,速度超快。方案三:使用国内的镜像源安装。在原来安装时在命令里加一个参数 -i,然后在i后原创 2020-05-29 20:37:02 · 6988 阅读 · 0 评论 -
python——内置数据类型学习(list、tuple、dict、set)
列表内可以是数字也可以是列表,也可以是字符串,列表用a[]表示列表示有序的,可以按照索引进行查找,如常见的数组a[0]append函数是像列表内添加元素x.append()在列表尾部插入元素 x.insert(1,“a”)在列表制定位置插入元素x.extend()函数是将列表中一个函数一次加入到另一个列表中去x.pop()在列表尾部删除元素 x.remove()删除特定元素del x...原创 2020-05-05 16:34:08 · 319 阅读 · 0 评论 -
pandas学习——综合练习题
文本数据、分类数据、时序数据【练习一】现有一份虚拟数据集,列类型分别为string/浮点/整型,请解决如下问题:(a)请以列类型读入数据,并选出C为缺失值的行。(b)现需要将A中的部分单元转为缺失值,单元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比。df.dtypesdf[df['C'].isna()](b)现需要将A中的部分单元转为缺失值,单元格中的最小转...原创 2020-05-01 21:29:03 · 1189 阅读 · 0 评论 -
pandas学习-----05合并
问题【问题一】 请思考什么是append/assign/combine/update/concat/merge/join各自最适合使用的场景,并举出相应的例子。【问题二】 merge_ordered和merge_asof的作用是什么?和merge是什么关系?¶【问题三】 请构造一个多级索引与多级索引合并的例子,尝试使用不同的合并函数。【问题四】 上文提到了连接的笛卡尔积,那么当连接方式变...原创 2020-05-01 21:16:54 · 324 阅读 · 0 评论 -
pandas学习——第四次任务——变形
Task04:变形 理论部分熟悉3个透视函数的区别与用法理解stack和unstack状态掌握变形函数的各类使用场合了解哑变量和因子化的用法练习部分非法药物数据集的变形操作某国地震数据集的变形操作df = pd.read_csv('data/Drugs.csv',index_col=['State','COUNTY']).sort_index()df.head()【练...原创 2020-04-28 19:01:16 · 344 阅读 · 0 评论 -
任务三----(分组)练习题-----pandas学习
理论部分理解SAC过程和groupby机制掌握分组三大操作:聚合、过滤和变换熟悉 apply 函数用法练习部分钻石数据集分析非法药物数据集分析习题讲解【练习一】: 现有一份关于diamonds的数据集,列分别记录了克拉数、颜色、开采深度、价格,请解决下列问题:描述如下(a) 在所有重量超过1克拉的钻石中,价格的极差是多少?df = pd.read_csv('data/...原创 2020-04-28 18:33:03 · 920 阅读 · 0 评论 -
pandas----索引-----(数据分析)
理论部分熟练掌握多种单层索引方式及其异同掌握和理解多级索引操作熟悉常用索引设定方法及其区别掌握索引函数、去重函数和抽样函数练习部分UFO数据集分析口袋妖怪数据集分析一、单级索引loc方法、iloc方法、[]操作符最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大的便利性,各有特点(a)loc方法(注意:所有在loc中使用的切...原创 2020-04-23 15:54:46 · 360 阅读 · 0 评论 -
数据挖掘入门——天池二手车数据挖掘(04模型融合)
赛题链接4.1 模型融合目标对于多种调参完成的模型进行模型融合。完成对于多种模型的融合,提交融合结果并打卡。4.2 内容介绍模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging...原创 2020-03-30 11:09:03 · 460 阅读 · 0 评论 -
零基础入门数据挖掘——二手车交易价格预测(03建模调参)
赛题地址3.1 学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程 完成相应学习打卡任务3.2 内容介绍线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;嵌入式特征选择:Lasso回归;Ridge回归;决策树;模型对比:常用线...原创 2020-03-30 10:22:06 · 752 阅读 · 1 评论 -
零基础入门数据挖掘——02特征工程
##数据挖掘—— 02特征工程DataWhale一起组队学习:天池比赛1.含义将数据转换为能更好表示潜在问题的特征,从而更好提高机器学习的性能。包括数据理解,清洗,构造,选择和不平衡等。2.目的将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的性能。比如,异 常值处理是为了去除噪声,填补缺失值可以加入先验知识,增强数据的表达。特征工程是一个入门简单,但想精通非常难的一件事。3...原创 2020-03-27 12:13:22 · 360 阅读 · 0 评论 -
安装python包常见问题
有时安装一些包时,会存在包太大,一时下载不下来,使用pip安装时会报错,网络超时,此处就以bayes-opt安装为例bayes-opt1、命令行安装pip install bayesian-optimization2、找到bayesian-optimization 0.6.0包的地址:https://pypi.org/project/bayesian-optimization/0.6.0/...原创 2020-03-26 10:50:42 · 826 阅读 · 2 评论 -
使用pip安装numpy,pandas,matplotlib等安装包时常见问题
安装python包常见问题1、pip install +安装包名称2、conda install +安装包名称3、可以通过安装包的的github仓库如pandas-profiling的仓库:https://github.com/pandas-profiling/pandas-profiling.下载zip文件,解压后,cd到源码根目录,运行下面代码python setup.py ins...原创 2020-03-23 21:51:02 · 862 阅读 · 0 评论 -
python程序以及图片的打包,exe程序logo的制作
1.打包的库pyinstaller通过PC端win+R,输入cmd进入控制台界面,cd到你的文件夹下可以通过pip命令操作安装:pip install pyinstaller有时候会出现两种错误:其中一种是pip命令也许需要更新,此时就可以先更新pip, python -m pip install --upgrade pip第二种错误,是由于网络超时造成的,可能是网络不稳定,因为下载的镜...原创 2020-03-02 12:03:06 · 1405 阅读 · 0 评论