![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 61
AIDD Learning
聚焦全球人工智能与药物研发领域进展,探索生物医药行业创新。
展开
-
RDKit新手入门
RDKit介绍、安装、简单可视化和相似性搜索原创 2022-07-06 18:04:54 · 2065 阅读 · 0 评论 -
机器学习——回归
原创 2021-07-15 09:37:09 · 69 阅读 · 0 评论 -
机器学习技术介绍
原创 2021-07-12 22:35:51 · 1249 阅读 · 0 评论 -
WARNING: You are using pip version 20.0.1; however, version 21.1.2 is available.
pip更新方法(失败了一般用换一种方法就解决了)1,使用python -m pip install --upgrade pip升级失败2,使用python -m pip install -U --force-reinstall pip依然失败3,使用pip install --user --upgrade pip成功升级原创 2021-06-17 12:04:53 · 501 阅读 · 0 评论 -
task4—模型建立与调参
建模与调参1、学习目标了解常用的机器学习模型,并掌握机器学习模型的建模与调参流程2、内容介绍3、相关原理介绍与推荐3.1 线性回归模型https://zhuanlan.zhihu.com/p/494803913.2 决策树模型https://zhuanlan.zhihu.com/p/653047983.3 GBDT模型https://zhuanlan.zhihu.com/p/451458993.4 XGBoost模型https://zhuanlan.zhihu.com/p/86816转载 2021-04-21 11:04:24 · 342 阅读 · 1 评论 -
[二手车价格预测]task3-特征工程
特征工程1、特征工程目标对于特征进行进一步分析,并对于数据进行处理完成对于特征工程的分析,并对数据进行一些图标或者文字总结并打卡2、内容介绍3、代码示例#3.1导入数据import pandas as pdimport numpy as npimport matplotlibimport matplotlib.pyplot as pltimport seaborn as snsfrom operator import itemgetter%matplotlib inline原创 2021-04-19 10:56:33 · 189 阅读 · 0 评论 -
二手车价格预测---数据分析
一、代码示例#1.1载入各种数据库科学以及可视化库!pip show matplotlibName: matplotlibVersion: 3.0.3Summary: Python plotting packageHome-page: http://matplotlib.orgAuthor: John D. Hunter, Michael DroettboomAuthor-email: matplotlib-users@python.orgLicense: PSFLocation: .原创 2021-04-16 21:44:42 · 1434 阅读 · 0 评论 -
二手车接个预测——task01赛题理解
一、代码示例#1、数据读取pandasimport pandas as pdimport numpy as nppath='./data/'##1)载入训练集和测试集(一般测试集和训练集不是人为分的)Train_data = pd.read_csv(path+'train.csv', sep=' ')Test_data = pd.read_csv(path+'testA.csv', sep=' ')print('Train data shape:',Train_data.shape)pr原创 2021-04-13 21:23:50 · 109 阅读 · 2 评论 -
特称工程是什么?
目录1特征工程是什么2 数据预处理2.1 无量纲化2.1.1 标准化2.1.2 区间缩放法2.1.3 标准化与归一化的区别2.2 对定量特征二值化2.3 对定性特征哑编码2.4 缺失值计算2.5 数据变换3 特征选择3.1 Filter3.1.1 方差选择法3.1.2 相关系数法3.1.3 卡方检验3.1.4 互信息法3.2 Wrapper3.2.1 递归特征消除法3.3 Embedded3.3.1 基于惩罚项的特征选择法3.3.2 基转载 2021-04-01 11:31:47 · 174 阅读 · 0 评论 -
创建新环境后,如何在Jupyter Notebook中使用新环境?
目录第一步:打开cmd,切换你要使用的那个环境,使用命令activate 环境名如图,说明你已经切换到你想要的环境下了。第二步:在cmd上,输入jupyter notebook,等待片刻,就会跳转到你所选环境下的jupyter notebook中了。jupyter notebook第三步:你就可以使用你新环境下的jupyter notebook啦。第四步:如何选择Kernel,如下图,内核有三个,应该选择哪个?应当选择你这个环境下的内核,也就是tfc环境的内核原创 2021-03-25 23:05:11 · 3615 阅读 · 0 评论 -
新环境下的jupyter notebook 要配置内核吗?
新环境下的jupyter notebook 要配置内核。配置内核的方法:第一步:在cmd中进入你想要的的那个虚拟环境activate 环境名第二步:1、安装ipykernelpip install ipykernel2、添加虚拟环境kernelpython -m ipykernel install --user --name envnameeg:python -m ipykernel install --user --name tfc大功告成!...原创 2021-03-25 23:04:02 · 1376 阅读 · 3 评论 -
第五章+变形
第五章 变形import numpy as npimport pandas as pd一、长宽表的变形什么是长表?什么是宽表?这个概念是对于某一个特征而言的。例如:一个表中把性别存储在某一个列中,那么它就是关于性别的长表;如果把性别作为列名,列中的元素是某一其他的相关特征数值,那么这个表是关于性别的宽表。下面的两张表就分别是关于性别的长表和宽表:pd.DataFrame({'Gender':['F','F','M','M'], 'Height':[163, 160, 175, 180]})原创 2020-12-27 20:20:00 · 504 阅读 · 0 评论 -
第四章+分组
第四章 分组import numpy as npimport pandas as pd一、分组模式及其对象1. 分组的一般模式分组操作在日常生活中使用极其广泛,例如:依据性别\color{#FF0000}{性别}性别分组,统计全国人口寿命\color{#00FF00}{寿命}寿命的平均值\color{#0000FF}{平均值}平均值依据季节\color{#FF0000}{季节}季节分组,对每一个季节的温度\color{#00FF00}{温度}温度进行组内标准化\color{#0000FF}原创 2020-12-24 12:02:11 · 258 阅读 · 0 评论 -
Pandas数据分析——Task2
练习题Ex1:口袋妖怪数据集现有一份口袋妖怪的数据集,下面进行一些背景说明:#代表全国图鉴编号,不同行存在相同数字则表示为该妖怪的不同状态妖怪具有单属性和双属性两种,对于单属性的妖怪,Type 2为缺失值Total, HP, Attack, Defense, Sp. Atk, Sp. Def, Speed分别代表种族值、体力、物攻、防御、特攻、特防、速度,其中种族值为后6项之和对HP, Attack, Defense, Sp. Atk, Sp. Def, Speed进行加总,验...原创 2020-12-19 20:55:23 · 900 阅读 · 3 评论 -
pandas数据分析--预备知识
原创 2020-12-14 21:46:34 · 73 阅读 · 0 评论 -
Python、Anaconda、TensorFlow、Pycharm之间的关系以及下载安装
本文内容:一、解释四者之间的关系二、Anaconda的下载与安装三、Pycharm的下载与安装四、TensorFlow的安装小结和展望一、解释四者之间的关系Python ———— 编译环境(类似于C、JAVA等这些编译环境)Anaconda ———— python+conda(包管理器)+科学计算库TensorFlow ———— 一种架构,类似于PytorchPycharm ———— 集成开发环境1、Python和Anaconda的关系Anaconda里.原创 2020-11-09 11:44:50 · 3003 阅读 · 0 评论