笔记
文章平均质量分 62
于得水Fake_water
过街天桥上贴膜,地下通道里卖唱。
展开
-
正则表达式笔记
1.正则表达式的使用场景无外乎两种:一种是查找特定的信息(搜索),另一种是查找并编辑特定的信息(替换)。2.1 匹配单个字符原创 2021-01-18 13:39:57 · 192 阅读 · 0 评论 -
python回归预测,从变量加工到建模预测(分子模型)RF,LGB,SVR,DNN实现
import numpy as npimport pandas as pd# import pyreadstatimport timeimport datetime as dtfrom sklearn.model_selection import GridSearchCVfrom sklearn.model_selection import cross_val_scoreimport matplotlib.pyplot as pltfrom scipy import statsimport原创 2020-06-06 10:28:08 · 1616 阅读 · 0 评论 -
python进行主成分、因子分析
import numpy as npimport pandas as pdimport matplotlib.pyplot as pltimport matplotlib as mpl#画图中的显示中文mpl.rcParams['font.sans-serif'] = ['simHei']mpl.rcParams['axes.unicode_minus'] = Falsefrom factor_analyzer import FactorAnalyzerpath = 'E:/data/'原创 2020-06-06 09:52:16 · 12843 阅读 · 26 评论 -
机器学习小技巧,各算法建模代码
一、机器学习常用技巧1.自动编码方法: 第一种是pd.Categorical().Codes 第二种是用:LableEncoder非常智能,会按照原数据的某种顺序关系来编码 sklearn:先from sklearn.preprocessing import LableEncoder LableEncoder().fit_transform(dat...原创 2020-03-30 14:59:34 · 1045 阅读 · 0 评论 -
机器学习算法汇总梳理
1 逻辑回归(LR):将线性回归的结果通过sigmoid函数映射到了(0,1)区间,可以当做是正例的概率,从而实现分类。不能实现回归。2 决策树(DT):决策树是一种递归的选择最优特征,然后根据最优特征分割数据集,使得各个子集都有一个最好的分类。回归则是通过最小二乘法来实现。不同的算法有不同的分类依据:算法ID3C4.5CART分类依据信息增益信息增益率基尼...原创 2020-03-01 23:52:19 · 2135 阅读 · 7 评论