- 博客(10)
- 收藏
- 关注
原创 Pandas常用用法
一、生成数据表1、首先导入pandas库,一般都会用到numpy库,所以我们先导入备用:import numpy as npimport pandas as pd2、导入CSV或者xlsx文件:df = pd.DataFrame(pd.read_csv(‘name.csv’,header=1))df = pd.DataFrame(pd.read_excel(‘name.xlsx’))...
2021-05-11 14:16:44 244
原创 Numpy基本用法
一、矩阵与数组的区别:矩阵是一个数学概念,数组是信息科学上的概念; 矩阵元素只能是数值,数值可以是数值,数字,字符,字符串等; 数组array可以是任意维的,矩阵matrix只能是2维的; 编程上,一维数组相当于向量,二维数组相当于矩阵;数学上,向量就是1×N或N×1的矩阵,即行向量或列向量。所以矩阵可以理解为是数组的子集; 运算上,numpy里矩阵和数组运算使用通常符号,在元素之间运...
2019-05-07 11:59:54 162
原创 机器学习算法基础
监督学习对于有标签的特定数据集(训练集)是非常有效的,但是它需要对于其他的距离进行预测。无监督学习对于在给定未标记的数据集(目标没有提前指定)上发现潜在关系是非常有用的。强化学习介于这两者之间—它针对每次预测步骤(或行动)会有某种形式的反馈,但是没有明确的标记或者错误信息。半监督学习是一种有监督学习和无监督学习想结合的一种方法,其主要思想是基于数据分布上的模型假设,利用少量的已标注数...
2018-12-03 23:36:05 1368 2
原创 数据基本特征
目录一、数据知识二、数据预处理三、属性的相似度和相异度一、数据知识如果若干属性是强相关的,则说明这些属性可能提供了高度冗余的信息,我们可以决定只保留一个。二、数据预处理1、维规约:通过创建新属性,将一些旧属性合并在一起来降低数据的维度。通过选择旧属性的子集得到的新属性,这种维规约称为特征子集选择。2、维灾难:数据维度(属性)过高。数据稀疏,对于分类,没有足够...
2018-11-17 22:02:51 4614
翻译 欢迎使用markdown编辑器
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I...
2018-11-17 21:41:32 145
原创 【分类算法】决策树
目录 一、预备知识:二、决策树定义三、决策树1、决策树基础--Hunt算法2、属性划分 3、属性划分标准4、决策树算法5、模型过拟合6、评估分类器性能一、预备知识:分类:通过学习得到一个目标函数f,也称为分类模型,把每一个属性集x映射到一个预先定义的类标号y。目的:描述性建模:分类模型作为解释性工具,用于区分不同类中的对象 ...
2018-11-17 21:21:03 668
翻译 python数据分析股票
英文出处:Curtis Miller这篇博文是用Python分析股市数据系列两部中的第一部,内容基于我犹他大学 数学3900 (数据科学)的课程。在这些博文中,我会讨论一些基础知识。比如如何用pandas从雅虎财经获得数据, 可视化股市数据,平局数指标的定义,设计移动平均交汇点分析移动平均线的方法,回溯测试, 基准分析法。最后一篇博文会包含问题以供练习。第一篇博文会包含平局数指标以及之前的内容...
2018-09-22 09:13:39 2447
原创 分享内网渗透域的经验积累
1.ipconfig /all//可以查看到当前网卡配置信息,包括所属域以及IP段这个命令可以看到:主机名字—shwdm,IP–192.168.103.8,网关IP—192.168.103.10,DNS 域名解析地址IP—192.168.100.1,主WINS服务器IP—10.0.22.52.net view//显示正由指定的计算机共享的域、计算机或资源的列表。如果在没有参数的情况...
2018-09-20 12:59:07 138
翻译 使用Python一步一步地来进行数据分析总结
原文链接:Step by step approach to perform data analysis using Python 译文链接:使用Python一步一步地来进行数据分析--By Michael翔你已经决定来学习Python,但是你之前没有编程经验。因此,你常常对从哪儿着手而感到困惑,这么多Python的知识需要去学习。以下这些是那些开始使用Python数据分析的初学者的普遍遇到的...
2018-09-11 11:52:47 499
原创 Git 常用命令
Git 常用命令创建目录:mkdir learngit切换目录:cd learngit显示当前目录:pwd初始化:git init添加文件:git add 文件名提交文件:git commit -m “注释”查看状态:git status查看修改内容:git diff查看修改记录:git log回退版本:git reset –hard commit_id o...
2018-09-05 13:31:24 124
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人