Python开发工程师

叙事、说情、谈见解、聊技术,公众号:it男余康的逻辑思维

初学go语言开发第一个爬虫项目

package main import ( "fmt" "net/http" "os" "regexp" "strconv" "strings" ) func...

2019-05-25 10:31:16

阅读数 17

评论数 0

深入浅出带你理解 静态方法和类方法的区别

class A(): x1 = 3 def __init__(self): self.num = 1 @ staticmethod def test1(): print("这里是静态方法输出") ...

2019-05-14 16:35:39

阅读数 11

评论数 0

深入探索TextRank提取文本关键词(干货附带完整注释代码)

TextRank算法介绍   先说一下自动文摘的方法。自动文摘(Automatic Summarization)的方法主要有两种:Extraction和Abstraction。其中Extraction是抽取式自动文摘方法,通过提取文档中已存在的关键词,句子形成摘要;Abstraction是生成式...

2019-04-10 18:08:52

阅读数 199

评论数 0

深入探索tf-idf提取文本关键词(干货附带完整注释代码)

TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。TF意思是词频(Term Frequency),IDF意思是逆文本频率指数(Inverse Document Frequency)。 TF-IDF实际上是...

2019-04-10 18:03:20

阅读数 63

评论数 0

'ascii' codec can't encode characters in position 144-145: ordinal not in range(128) (Linux中py3)

用 python 将数据插入到Oracle 数据库 一直报这个错,(Linux运行) 检查编码各项都没有发现问题,但是讲 赋值之后的sql 拿出来插入是可以成功的。 网上查了很多解决方案都是: importsys reload(sys) sys.setdefaultencoding('u...

2019-03-29 17:48:40

阅读数 24

评论数 0

Linux程序前台后台切换(问题解决转载备用)

fg、bg、jobs、&、nohup、ctrl+z、ctrl+c 命令 一、& 加在一个命令的最后,可以把这个命令放到后台执行,如 watch -n 10 sh test.sh & #每10s在后台执行一次test.sh脚本 二、ctrl + z...

2019-03-20 15:54:38

阅读数 31

评论数 0

Windows下安装Pytorch

找了很多都发现是下载不了的, 找了下发现目前没有Windows版本。 但是 似乎知乎有解决方案,本人因为个人原因没有测试。 附上链接 : Windows下安装Pytorch 感谢这位大神的分享。 ...

2019-03-05 15:44:35

阅读数 93

评论数 0

Win10上安装CUDA10 (tensorflow1.12+py3.6+cuda10+win10)

Win10上的CUDA10库装上了,anaconda最新版有坑,最终还是回到anaconda3.5搞定 网盘链接如下,有需要的自取 链接:https://pan.baidu.com/s/1iJtjydqfSyJbW6KnYe3ZZw  提取码:fhwp  复制这段内容后打开百度网盘手机App,操...

2019-02-02 11:24:31

阅读数 832

评论数 0

go语言编译器LiteIDE安装和下载

LiteIDE编译器下载地址 链接:https://pan.baidu.com/s/1DQgTpg_5TpRg6Gz4X7GJkA  密码:vgoe   解压之后找到目录:liteide\bin下的liteide.exe双击打开即可。   GO语言下载安装地址 官网安装包下载地址为:...

2018-09-21 10:15:35

阅读数 514

评论数 0

sklearn如何做好特征工程

以下内容相关包信息:Python3 相关下载 主要包:sklearn(scikit-learn),numpy ,scipy 安装:pip install 包名 ,建议安装顺序numpy,scipy,sklearn(scikit-learn) 以下信息参考于知乎,对于部分信息进行修改: 1 ...

2018-09-07 10:47:27

阅读数 4246

评论数 0

No module named 'sklearn.lda'

当我们使用 sklearn 调用 lda 中的 线性判别分析法(LDA)报错问题。 from sklearn.lda import LDA   这种调用方式是老版本的 sklearn  我们应该尝试用新版本的调用方式就可以解决问题。 解决方式: from sklearn.dis...

2018-09-07 10:23:52

阅读数 3143

评论数 0

机器学习之信息增益(熵和条件熵)

本文转载于:https://blog.csdn.net/chunyun0716/article/details/51289940 要了解信息增益,我们要先知道熵与条件熵的定义。 2.1 熵 熵是无序度的度量,在信息论和统计中,熵表示随机变量不确定性的度量。假设XX是一个取有限值的离散型随机变...

2018-09-07 10:00:32

阅读数 4587

评论数 0

机器学习之特征选择方法总结

文章转载于:https://blog.csdn.net/lihaitao000/article/details/51213563?hmsr=toutiao.io&utm_medium=toutiao.io&utm_source=toutiao.io 1、为什么...

2018-09-07 09:18:34

阅读数 1206

评论数 0

人工智能算法公式中常见的数据符号的定义和解释?

长期更新中......   没有记录的希望大家留言补充   对数:(log,lg,ln,lb) log log4 (8)=log4 (4*2)=log4 (4)+log4 (2)=1+0.5=1.5 log4 (2)=0.5因为4的1/2次方是2 ln 是底数为e的对数,比如ln3,就...

2018-09-06 19:20:23

阅读数 1756

评论数 0

统计学离散型变量和连续型变量有什么区别?

离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. 反之,在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体...

2018-09-06 18:48:07

阅读数 8468

评论数 0

机器学习度量方式之基尼不纯度(Gini impurity)和信息熵(Python实现)

决策树是一种简单的机器学习方法。决策树经过训练之后,看起来像是以树状形式排列的一系列if-then语句。一旦我们有了决策树,只要沿着树的路径一直向下,正确回答每一个问题,最终就会得到答案。沿着最终的叶节点向上回溯,就会得到一个有关最终分类结果的推理过程。 以下为决策树过程: 初始化: #!...

2018-09-06 18:34:55

阅读数 4220

评论数 0

皮尔森相关系数和样本方差

数据来源百度百科 皮尔森相关系数 皮尔森相关系数的公式为: 样本的简单相关系数一般用r表示,其中n 为样本量, 分别为两个变量的观测值和均值。r描述的是两个变量间线性相关强弱的程度。r的取值在-1与+1之间,若r>0,表明两个变量是正相关,即一个变量的值越大,另一个变量的值...

2018-09-06 14:59:37

阅读数 1156

评论数 0

递归特征消除Recursive feature elimination (RFE)

递归特征消除的主要思想是反复的构建模型(如SVM或者回归模型)然后选出最好的(或者最差的)的特征(可以根据系数来选),把选出来的特征选择出来,然后在剩余的特征上重复这个过程,直到所有特征都遍历了。这个过程中特征被消除的次序就是特征的排序。因此,这是一种寻找最优特征子集的贪心算法。  RFE的稳定...

2018-09-06 09:32:12

阅读数 2282

评论数 0

机器学习特征选择之卡方检验与互信息

本文转载于:https://blog.csdn.net/yihucha166/article/details/50646615 特征选择的主要目的有两点: 1.减少特征数量提高训练速度,这点对于一些复杂模型来说尤其重要 2.减少noisefeature以提高模型在测试集上的准确性。一些噪...

2018-09-05 19:41:39

阅读数 1032

评论数 0

数据预处理中常见的哑编码/独热编码(One-Hot Encoding)详解(一看就懂)

通常需要处理的数值都是稀疏而又散乱地分布在空间中,然而,我们并不需要存储这些大数值,这时可以用独热编码。 例如:我们需要处理4维向量空间,当给一个特征向量的第n个特征进行编码时,编码器会遍历每个特征向量的第n个特征,然后进行非重复计数。若第n个特征的最大值为K,则就把这个特征转换为只有一个值为1...

2018-09-04 15:47:08

阅读数 3834

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭