![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
基础
CristinaM
这个作者很懒,什么都没留下…
展开
-
【特征工程】特征选择Feature Selection
正好在写这部分,就顺带练习一下吧。一如既往地,来源:https://towardsdatascience.com/feature-selection-techniques-1bfab5fe0784数据集:https://www.kaggle.com/uciml/mushroom-classification减少特征数量的好处有:准确性提高。减少过度拟合。加快训练速度。改进数据可视化...原创 2020-01-06 21:42:10 · 444 阅读 · 0 评论 -
【基础概念】Matplotlib里的plt.xxx(), or ax.xxx()
侵删,来源:https://towardsdatascience.com/plt-xxx-or-ax-xxx-that-is-the-question-in-matplotlib-8580acf42f44坑坑坑,等有空再看。原创 2020-01-05 20:43:40 · 466 阅读 · 0 评论 -
【基础概念】P-values的解释
无授权,自留,侵删:P-values Explained By Data Scientist四个部分:Hypothesis TestingNormal DistributionWhat is P-value?Statistical Significance1.Hypothesis Testing首先了解一下hypothesis testing ,在这里, p-value 被用来...转载 2019-12-24 21:59:16 · 4431 阅读 · 0 评论 -
【gis学习】把从栅格中获取的投影坐标转换为经纬度
获取相应坐标系import gdalimport numpy as npfrom osgeo import osrdataset = gdal.Open("C:\\Users\\Nihil\\Desktop\\Arcgisdata\\HPDEM.tif")adfGeoTransform = dataset.GetGeoTransform()get_ref = dataset.GetS...原创 2019-12-18 11:06:34 · 1695 阅读 · 0 评论 -
【gis学习】GDAL获取栅格数据各个像素对应的经纬度
参考:GDAL获取栅格数据各个像素对应的经纬度(Python版)gdal GetGeoTransform解释 GetProjectionRef//如果图像不含地理坐标信息,默认返回值是:(0,1,0,0,0,1)//In a north up image,//左上角点坐标(padfGeoTransform[0],padfGeoTransform[3]);//padfGeoTransfor...原创 2019-12-18 10:18:57 · 6675 阅读 · 7 评论 -
【语言分析】看看我为了不写英语作业都做了些什么
Text Mining in Python: Steps and Examples词性标注(Part-of-speech tagging)词性标注(Part-of-speech tagging)(自然语言处理文档系列)Penn Treebank词性标记集import pandas as pdimport numpy as npimport osimport nltk.corpus...原创 2019-12-14 22:57:59 · 172 阅读 · 0 评论 -
【特征工程】(资料)使用Xgboost筛选特征重要性
资料:Using XGBoost For Feature SelectionFeature Importance and Feature Selection With XGBoost in Python原创 2019-12-14 16:42:10 · 886 阅读 · 0 评论 -
【基础概念】(自存)几种验证模型的方法(交叉验证及模型对比)
使用适当的验证技术可以帮助您理解您的模型,但最重要的是,评估一个无偏的泛化性能。转载 2019-12-14 11:33:08 · 5037 阅读 · 0 评论 -
【Pandas操作】之列名
1. 参考:Pandas中修改DataFrame列名创建一个DataFrameimport pandas as pda = pd.DataFrame({'A':[1,2,3], 'B':[4,5,6], 'C':[7,8,9]})print(a) A B C0 1 4 71 2 5 82 3 6 9方法1,直接赋值缺点:必须把所有的列名都写上,否则...原创 2019-12-10 09:11:13 · 1146 阅读 · 0 评论 -
【基础概念】什么是benchmark model?
阅读文献的时候提到多次,决定还是存一些资料。What is a benchmark model?Benchmarking Predictive Models基准测试流程可能需要运行多次,并使用一个聚合平滑度量 smoothed measure(如中值median value)进行比较为了Benchmarking Models,set.seed,random.seed等的意义就出现了...原创 2019-12-09 14:56:01 · 4313 阅读 · 0 评论 -
.shape[0]
import numpy as npimport pandas as pdc= np.array(([[1,1],[1,2],[1,3],[1,4]]))c = pd.DataFrame(c)print(c) 0 10 1 11 1 22 1 33 1 4print(c.shape[0])4原创 2019-12-08 14:27:05 · 1549 阅读 · 1 评论