- 博客(16)
- 资源 (30)
- 收藏
- 关注
原创 Pattern Recognition And Machine Learning 第一章
1 绪论1.训练数据的样本包含输⼊向量以及对应的⽬标向量的应⽤叫做有监督学习(supervised learning)问题。3.在其他的模式识别问题中,训练数据由⼀组输⼊向量x组成,没有任何对应的⽬标值叫做⽆监督学习(unsupervised learning)问题。4.给每个输⼊向量分配到有限数量离散标签中的⼀个,被称为分类(classification)问题。如果要求的输出由⼀个或者多个连续 变量组成,那么这个任务被称为回归(regression)。5.是发现数据中相似样本的 分组,这被
2021-03-25 22:19:28 1349
原创 Random Forest(七)
#Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd#Improting the datasetdataset = pd.read_csv("Social_Network_Ads.csv")X = dataset.iloc[:,[2,3]].valuesy = dataset.iloc[:,4].values#Splitting the dataset i.
2021-03-22 21:06:25 157
原创 Decision Tree Classification(六)
#Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd#Importing the datasetdataset = pd.read_csv("Social_Network_Ads.csv")X = dataset.iloc[:,[2,3]].valuesy = dataset.iloc[:,4].values#Splitting the dataset i.
2021-03-22 20:31:55 223
原创 python 决策边界 代码
已知的代码:X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=33)LRclassifier = LogisticRegression()LRclassifier.fit(X_train, y_train)决策边界的实现:对于训练集:from matplotlib.colors import ListedColormapX_set,y_set = X_trai
2021-03-22 19:58:18 701
原创 Support Vector Machine(五)
#Importing the librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pd#Importing the datasetdataset = pd.read_csv("Social_Network_Ads.csv")X = dataset.iloc[:,[2,3]].valuesy = dataset.iloc[:,4].values#Splitting the dataset i.
2021-03-22 19:48:26 153
原创 Implementing Logistic Regression(四)
#Step1 Dara Pre-Processing#importing the Librariesimport numpy as npimport matplotlib.pyplot as pltimport pandas as pdimport seaborn as sns#import the datasetdataset = pd.read_csv("Social_Network_Ads.csv")X = dataset.iloc[:,[2,3]].values #get the.
2021-03-22 17:39:47 137 1
原创 Multiple Linear Regression(三)
#Step1 Data Preprocessing#importing the librariesimport pandas as pdimport numpy as np#importing the datasetdataset = pd.read_csv("50_Startups.csv")X = dataset.iloc[:,:-1].valuesy = dataset.iloc[ : , 4 ].values#Encoding Categorical datafrom sk.
2021-03-21 17:48:18 280
原创 seaborn 小技巧
柱状图:fig = sns.barplot(x=Barname,y=Barval)显示y轴值:for p in fig.patches: height = p.get_height() print(p.get_height()) fig.text(x = p.get_x()+(p.get_width()/2), y = height+0.01,s = '{:.4f}'.format(height),ha = 'center')显示标题:fig.se
2021-03-21 17:25:36 531
原创 Simple Linear Regression(二)
#Data Preprocessingimport pandas as pdimport numpy as npimport matplotlib.pyplot as pltdataset =pd.read_csv("studentscores.csv")X = dataset.iloc[ : , :1].valuesy = dataset.iloc[ : ,1].valuesfrom sklearn.model_selection import train_test_splitX_t.
2021-03-21 17:19:58 162
原创 Data PreProcessing(一)
#Importing the librariesimport numpy as npimport pandas as pd#import the datasetdataset = pd.read_csv("Data.csv")X = dataset.iloc[ : , :-1].valuesy = dataset.iloc[ : ,3].values#handling the missing datafrom sklearn.impute import SimpleImputerim.
2021-03-21 16:51:47 353
原创 Pipeline + GridSearchCV
Pipleline:导管,保存需要进行的步骤,程序会根据导管里的顺序依次进行。GridSearchCV:1.网格搜索,搜索出模型最好的参数。2.其中param_grid是一个列表形式,为模型的参数设置,这些设置的查看方式为:from sklearn.naive_bayes import GaussianNBfrom sklearn.neighbors import KNeighborsClassifierNB = GaussianNB()KNN = KNeighborsClas
2021-03-17 21:27:45 1021
原创 材料数据科学:描述符和机器学习
内容:如何使用matminer、automatminer、panases和scikit-learn来获取机器学习材料属性。典型的机器学习工作流,整个过程可以概括为:1 .获取原始输入,如作文列表和相关的目标属性来学习。2.将原始输入转换成可通过机器学习算法学习的描述符或特征。3.在数据上训练机器学习模型。4.绘制并分析模型的性能。1.数据检索和过滤Matminer与许多材料数据库接口,包括:-材料项目- Citrine - AFLOW -材料数据设施(MDF) -数据科学..
2021-03-14 20:52:50 14519 12
原创 机器学习在材料方向的应用(lightgbm+贝叶斯优化调参)
from pymatgen import Composition, Elementimport pandas as pdimport urllib.requestimport numpy as npfrom sklearn.model_selection import train_test_splitimport lightgbm as lgbfrom sklearn import datasetsfrom sklearn.model_selection import KFoldfrom.
2021-03-12 19:01:55 1198 2
原创 Materials Project预测晶系
import pymatgen as mgfrom pymatgen import MPResterfrom pymatgen import Composition, Elementimport itertoolsimport IPythonimport randomimport numpy as npfrom sklearn.naive_bayes import GaussianNBfrom sklearn.preprocessing import StandardScalerfrom.
2021-03-11 20:23:39 2630
原创 正则表达式深入浅出
1.基本匹配正则表达式其实就是在执⾏搜索时的格式,它由⼀些字⺟和数字组合⽽成。 例如:⼀个正则表达式 the ,它表示⼀个规则:由字⺟ t 开始,接着是 h ,再接着是 e 。"the" => The fat cat sat on the mat.在线练习正则表达式 123 匹配字符串 123 。它逐个字符的与输⼊的正则表达式做⽐较。 正则表达式是⼤⼩写敏感的,所以 The 不会匹配 the 。"The" => The fat cat sat on the mat.
2021-03-02 23:46:03 303
VASP5.4.4 安装包,可直接进行下一步tar
2022-10-31
MOTLD代码复现(运行主程序即可)
2021-08-11
阅读报告总结-Time series indexing by dynamic covering with cross.docx
2021-06-17
Time series indexing by dynamic covering with cross-range和注释.zip
2021-05-31
图片素描化代码包(含教程)
2021-05-14
PRML-code.zip
2021-04-11
Kaggle入门-泰坦尼克号之灾(数据集+代码+结果).zip
2021-02-06
vrp--车辆路径算法
2020-12-01
数据实战报告,日本建筑行业投资数据
2024-08-30
关于1992-2020年中国各省份分行业GDP增加值的探索
2024-08-30
重庆智慧交通方向比赛实例
2024-08-30
VASP5.4.4 安装包,可直接进行下一步tar
2022-10-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人