自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (11)
  • 收藏
  • 关注

原创 常用国外会议出版社及出版社地址

第一次写英文的会议论文时候,因为参考文献引用格式被导师说很多次。总结以下问题。如果参考的文献是书籍的话,一般要求给出出版社地址,出版社和出版年份。所以经常有人会发帖问诸如此类的问题:出版社morgan kaufmann publishers inc在什么地方?对于该出版社的参考文献应该是:San Francisco: Margan Kaufmann,1991。这里也有人将该社地址写为San Mateo, CA(California加利福尼亚可缩写为Calif.或CA)。注:旧金山,又称三藩市(Sa

2021-03-30 21:53:53 21346 4

原创 python导入安装包之使用国内镜像安装

此处以安装scipy,statsmodels包的时候一直超时失败报错为例:直接使用 pip install scipypip install statsmodels由于网络原因可能会超时,导致一直安装不上,之前提到可以到到官网找到安装包,使用迅雷加速下载.wheel文件安装,然后使用命令安装。或者到github下载源码进行安装 [源码安装]除了上述提到的两种方法,还可以使用国内镜像文件安装,速度超快。方案三:使用国内的镜像源安装。在原来安装时在命令里加一个参数 -i,然后在i后

2020-05-29 20:37:02 6778

原创 python——内置数据类型学习(list、tuple、dict、set)

列表内可以是数字也可以是列表,也可以是字符串,列表用a[]表示列表示有序的,可以按照索引进行查找,如常见的数组a[0]append函数是像列表内添加元素x.append()在列表尾部插入元素 x.insert(1,“a”)在列表制定位置插入元素x.extend()函数是将列表中一个函数一次加入到另一个列表中去x.pop()在列表尾部删除元素 x.remove()删除特定元素del x...

2020-05-05 16:34:08 297

原创 pandas学习——综合练习题

文本数据、分类数据、时序数据【练习一】现有一份虚拟数据集,列类型分别为string/浮点/整型,请解决如下问题:(a)请以列类型读入数据,并选出C为缺失值的行。(b)现需要将A中的部分单元转为缺失值,单元格中的最小转换概率为25%,且概率大小与所在行B列单元的值成正比。df.dtypesdf[df['C'].isna()](b)现需要将A中的部分单元转为缺失值,单元格中的最小转...

2020-05-01 21:29:03 1165

原创 pandas学习-----05合并

问题【问题一】 请思考什么是append/assign/combine/update/concat/merge/join各自最适合使用的场景,并举出相应的例子。【问题二】 merge_ordered和merge_asof的作用是什么?和merge是什么关系?¶【问题三】 请构造一个多级索引与多级索引合并的例子,尝试使用不同的合并函数。【问题四】 上文提到了连接的笛卡尔积,那么当连接方式变...

2020-05-01 21:16:54 310

原创 pandas学习——第四次任务——变形

Task04:变形 理论部分熟悉3个透视函数的区别与用法理解stack和unstack状态掌握变形函数的各类使用场合了解哑变量和因子化的用法练习部分非法药物数据集的变形操作某国地震数据集的变形操作df = pd.read_csv('data/Drugs.csv',index_col=['State','COUNTY']).sort_index()df.head()【练...

2020-04-28 19:01:16 317

原创 任务三----(分组)练习题-----pandas学习

理论部分理解SAC过程和groupby机制掌握分组三大操作:聚合、过滤和变换熟悉 apply 函数用法练习部分钻石数据集分析非法药物数据集分析习题讲解【练习一】: 现有一份关于diamonds的数据集,列分别记录了克拉数、颜色、开采深度、价格,请解决下列问题:描述如下(a) 在所有重量超过1克拉的钻石中,价格的极差是多少?df = pd.read_csv('data/...

2020-04-28 18:33:03 901

原创 pandas----索引-----(数据分析)

理论部分熟练掌握多种单层索引方式及其异同掌握和理解多级索引操作熟悉常用索引设定方法及其区别掌握索引函数、去重函数和抽样函数练习部分UFO数据集分析口袋妖怪数据集分析一、单级索引loc方法、iloc方法、[]操作符最常用的索引方法可能就是这三类,其中iloc表示位置索引,loc表示标签索引,[]也具有很大的便利性,各有特点(a)loc方法(注意:所有在loc中使用的切...

2020-04-23 15:54:46 332

原创 数据分析-PANDAS基础知识-第一天

与大白鲨一起组队学习学习路线:https://github.com/datawhalechina/team-learning/tree/master/Pandas%E6%95%99%E7%A8%8B%EF%BC%88%E4%B8%8A%EF%BC%89?from=singlemessagefighting~

2020-04-20 22:18:57 129

原创 数据挖掘入门——天池二手车数据挖掘(04模型融合)

赛题链接4.1 模型融合目标对于多种调参完成的模型进行模型融合。完成对于多种模型的融合,提交融合结果并打卡。4.2 内容介绍模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式。简单加权融合:回归(分类概率):算术平均融合(Arithmetic mean),几何平均融合(Geometric mean);分类:投票(Voting)综合:排序融合(Rank averaging...

2020-03-30 11:09:03 444

原创 零基础入门数据挖掘——二手车交易价格预测(03建模调参)

赛题地址3.1 学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程 完成相应学习打卡任务3.2 内容介绍线性回归模型:线性回归对于特征的要求;处理长尾分布;理解线性回归模型;模型性能验证:评价函数与目标函数;交叉验证方法;留一验证方法;针对时间序列问题的验证;绘制学习率曲线;绘制验证曲线;嵌入式特征选择:Lasso回归;Ridge回归;决策树;模型对比:常用线...

2020-03-30 10:22:06 708 1

原创 零基础入门数据挖掘——02特征工程

##数据挖掘—— 02特征工程DataWhale一起组队学习:天池比赛1.含义将数据转换为能更好表示潜在问题的特征,从而更好提高机器学习的性能。包括数据理解,清洗,构造,选择和不平衡等。2.目的将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的性能。比如,异 常值处理是为了去除噪声,填补缺失值可以加入先验知识,增强数据的表达。特征工程是一个入门简单,但想精通非常难的一件事。3...

2020-03-27 12:13:22 342

原创 安装python包常见问题

有时安装一些包时,会存在包太大,一时下载不下来,使用pip安装时会报错,网络超时,此处就以bayes-opt安装为例bayes-opt1、命令行安装pip install bayesian-optimization2、找到bayesian-optimization 0.6.0包的地址:https://pypi.org/project/bayesian-optimization/0.6.0/...

2020-03-26 10:50:42 753 2

原创 零基础入门数据挖掘——二手车交易价格预测(1、EDA数据探索分析)

Datawhale 零基础入门数据挖掘-Task2 数据分析赛题链接:二手车交易价格预测EDA-数据探索性分析EDA(Exploratory Data Analysis)是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法EDA的价值主要在于熟悉数据集,了解数据集,对数据集***进行...

2020-03-24 10:19:57 844

原创 使用pip安装numpy,pandas,matplotlib等安装包时常见问题

安装python包常见问题1、pip install +安装包名称2、conda install +安装包名称3、可以通过安装包的的github仓库如pandas-profiling的仓库:https://github.com/pandas-profiling/pandas-profiling.下载zip文件,解压后,cd到源码根目录,运行下面代码python setup.py ins...

2020-03-23 21:51:02 803

原创 python程序以及图片的打包,exe程序logo的制作

1.打包的库pyinstaller通过PC端win+R,输入cmd进入控制台界面,cd到你的文件夹下可以通过pip命令操作安装:pip install pyinstaller有时候会出现两种错误:其中一种是pip命令也许需要更新,此时就可以先更新pip, python -m pip install --upgrade pip第二种错误,是由于网络超时造成的,可能是网络不稳定,因为下载的镜...

2020-03-02 12:03:06 1368

原创 如何安装igragh,新人避免入坑

1.尝试了很多种方法,一直如下报错错误:提升DeprecationWarning(“为了避免与igraph项目发生名称冲突”,弃用警告:为避免与igraph项目发生名称冲突,此可视化库已重命名为“jgraph”。 请在方便时升级。解决方法如下几种情况:1、最初用pip install igraph命令安装之后,在python中加载igraph库(from igraph import *)报错...

2019-08-19 18:10:48 1058

原创 T-SNE可视化实现

在官网下载源代码:https://scikit-learn.org/stable/auto_examples/manifold/plot_t_sne_perplexity.html#sphx-glr-download-auto-examples-manifold-plot-t-sne-perplexity-py在运行过程中报错:提示应该是说应该更新numpy的版本,即输入以下命令:pip ...

2019-07-06 21:46:40 5158

原创 DAY01+deepwalk论文阅读以及算法的实现

deepwalk主要描述的是Deep Learning的方法学图结构, 学出每个节点的隐含表示(比较像LSA、LDA、word2vec)主要是基于随机游走实验步骤及代码1.http://www.perozzi.net/projects/deepwalk/论文地址2.https://github.com/phanein/deepwalk 代码可参照Python官方的解释https://p...

2019-07-04 19:07:18 1216 1

第2章 索引.rar

数据分析中的pandas索引相关练习,用jupyter notebook编写,Python Data Analysis Library 或 pandas 是连接 SciPy 和 NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。Comma-separated values (CSV) 文件表示在有关各方之间分发数据的最常见的方法之一。Pandas 提供了一种优化库功能来读写多种文件格式,包括 CSV 和高效的 HDF5 格式。

2020-04-23

零基础入门数据挖掘_Datawhale.rar

Datawhile分享的关于数据挖掘比赛----天池二手车数据挖掘比赛文件,其中包括数据探索,特征工程,建模调参,模型融合等具体步骤

2020-03-30

example[1].html

数据挖掘入门----天池二手车数据分析,使用pandas_filing生成的数据报告,打开数据报告时需要开启jupyter notebook

2020-03-30

statsmodels-0.11.1-cp37-none-win_amd64.rar

statsmodels安装包,适用于版本Python 3.7.4,当使用命令直接下载,通常会网络超时,导致不能正常安装,此时可以下载这里的文件,具体操作见博客,https://blog.csdn.net/christineNAN/article/details/105

2020-03-26

scipy-1.4.1-cp37-cp37m-win_amd64.rar

scipy安装包,适用于版本Python 3.7.4,当使用命令直接下载,通常会网络超时,导致不能正常安装,此时可以下载这里的文件,使用命令进行安装,具体操作见博客,https://blog.csdn.net/christineNAN/article/details/105

2020-03-26

pandas-profiling-master.rar

生成数据报告的安装包pandas-profiling,当使用命令直接下载,通常会网络超时,导致不能正常安装,此时可以下载这里的文件,具体操作见博客,https://blog.csdn.net/christineNAN/article/details/105

2020-03-26

pandas-0.25.3-cp37-cp37m-win_amd64.rar

使用命令直接下载,通常会网络超时,导致不能正常安装,此时可以下载这里的文件,具体操作见博客,https://blog.csdn.net/christineNAN/article/details/105

2020-03-26

numpy-1.18.2-cp37-cp37m-win_amd64.rar

使用命令直接下载,通常会网络超时,导致不能正常安装,此时可以下载这里的文件,具体操作见博客,https://blog.csdn.net/christineNAN/article/details/105

2020-03-26

matplotlib-3.2.0-cp37-cp37m-win_amd64.rar

matplotlib安装包,使用命令直接下载,通常会网络超时,导致不能正常安装,此时可以下载这里的文件,使用命令直接安装,具体操作见博客,https://blog.csdn.net/christineNAN/article/details/105

2020-03-26

htmlmin-0.1.12.tar.gz

htmlmin-0.1.12.tar.gz安装包,官网下载太慢,在这里可以直接下载,关于如何安装,见博客,https://blog.csdn.net/christineNAN/article/details/105112676,具体介绍可以参考

2020-03-26

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除