Python
Python
阿里巴巴首席技术官
NULL
展开
-
数据可视化利器之Matplotlib 笔记
1. HelloWorld 2. 直方图 import matplotlib as mpl import matplotlib.pyplot as plt height = [168,166,192,190,166,170,180,150] bins = range(150,190,5) plt.hist(height,bins=bins) plt.show()...原创 2020-02-15 17:44:51 · 249 阅读 · 0 评论 -
机器学习 数据降维
降维:维度:特征的数量 1. 特征选择的原因 冗余:部分特征的相关度高,容易消耗计算性能 噪声:部分特征对预测结果有影响 2. 特征选择是什么 特征选择就是单纯的从提取到的所有特征中选择部分特征作为训练集特征,特征在选择前和选择后可以改变值,也不改变值,但是选择后的特征维数肯定比选择前小 主要方法 Filter(过滤式):VarianceThreshold Emdedd...原创 2020-01-29 22:15:16 · 169 阅读 · 0 评论 -
机器学习 特征工程 特征预处理
特征预处理:通过特定的统计方法(数学方法)将数据转换成算法要求的数据 数值型数据: 标准缩放 归一化 缺失值 类别型数据:ont-hot编码 时间数据:时间的切分 1. 归一化 通过对原始数据进行交换把数据映射到(默认0,1)之间 公式 注:作用于每一列,max为一列的最大值,min为一列的最小值,那么x'' 为最终结果,mx,mi分别为指定区间值默认mx为1,m...原创 2020-01-28 20:46:19 · 155 阅读 · 0 评论 -
机器学习 特征工程 特征抽取
1. 特征工程 特征工程的定义:将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性 特征工程的意义:直接影响预测结果 2. Scikit-learn Python语言的机器学习工具 Scikit-learn包括许多知名的机器学习算法的实现 Scikit-learn文旦通过完善,容易上手,丰富的API,使其在学术界颇受欢迎 目前稳定版本在0...原创 2020-01-28 16:06:22 · 187 阅读 · 0 评论 -
Python pandas
pandas 适合处理表格型或异质型数据 numpy适合处理相同类型 1. Pandas数据结构 1.1 Series Series是一种一维数组对象,并包含了索引 如图,左侧是索引,右侧是值 obj.values 和 obj.index 可以查看对应的信息 指定索引创建 选择指定索引(标签)的值 从另一个角度来看,Series其实是一个有序的字典 可以将...原创 2020-01-28 13:54:08 · 289 阅读 · 0 评论 -
pip 镜像
参考https://blog.csdn.net/sinat_21591675/article/details/82770360 在C://user//xxx// 新建pip文件夹 , 新建文件 pip.ini , 文件内容是以下 [global] index-url = http://mirrors.aliyun.com/pypi/simple/ [install] trusted-...原创 2020-01-28 10:36:37 · 196 阅读 · 0 评论 -
Python Numpy库
1. 生成 ndarray array函数接收任意的序列型对象 array = [1,2,3,4] arr1 = np.array(array) 多层嵌套序列,如果长度相同 , 会自动转化为多维数组 array = [[1,2,3,4],[1,2,3,4]] arr1 = np.array(array) print(arr1) 可以使用方式来查看多维数组的信息 print("数组...原创 2020-01-27 21:41:21 · 600 阅读 · 0 评论 -
python 基础 名片管理系统
源码来源于 黑马python # 存储所有名片 card_list = [] def show_menu(): """ 显示菜单 """ print("*" * 50) print("欢迎使用【菜单管理系统】V1.0") print("") print("1. 新建名片") print("2. 显示全部") p...原创 2020-01-25 00:31:16 · 147 阅读 · 0 评论 -
Python爬虫
1.爬虫的分类 通用网络爬虫:百度、谷歌、雅虎等搜索引擎 特点 关键字获取目标,覆盖率很大 聚焦网络爬虫:特点到互联网上有选择的去抓取指定的目标和相关的主题内容 增量式网络爬虫:特点只采取增量式个更新或者是只爬取新产生或者已经发生变化的网页 深层网络爬虫:大部分内容是不可用通过静态链接获取到的,隐藏在搜索表单之后的一些数据有可能需要用户提交一些关键词才可以获得WEB页面 2.案例 ...原创 2019-07-28 20:17:56 · 264 阅读 · 0 评论