自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(138)
  • 收藏
  • 关注

转载 Redis学习笔记-2019.02,07更新

https://pan.baidu.com/s/1l2-aPnJiq9k9zd7dUFHGbg转载于:https://www.cnblogs.com/yongfuxue/p/10355552.html

2019-02-07 21:15:00 273

转载 数据结构与算法学习笔记-2019.02.07更新

https://pan.baidu.com/s/1utMhMfqoh8mCUVJ9f3QY-w转载于:https://www.cnblogs.com/yongfuxue/p/10355551.html

2019-02-07 21:14:00 183

转载 SQL学习笔记-2019.02.07更新

https://pan.baidu.com/s/1nQrbNpkURDpr16pvtqT67A转载于:https://www.cnblogs.com/yongfuxue/p/10355550.html

2019-02-07 21:13:00 181

转载 爬虫-2019.02.07更新

https://pan.baidu.com/s/1nEUnHD8x9XptiDkOqwhxYw转载于:https://www.cnblogs.com/yongfuxue/p/10355549.html

2019-02-07 21:11:00 149

转载 数据挖掘项目学习笔记-2019.02.07更新

https://pan.baidu.com/s/1UglOpHC-iDC8FC22QIRFmg转载于:https://www.cnblogs.com/yongfuxue/p/10355546.html

2019-02-07 21:08:00 98

转载 spark-core学习笔记-2019.02.07更新

https://pan.baidu.com/s/16LhTth959qJn_LAJGUD_Kg转载于:https://www.cnblogs.com/yongfuxue/p/10355539.html

2019-02-07 21:03:00 125

转载 spark-GraphX学习笔记-2019.02.07更新

https://pan.baidu.com/s/1GPvIAgriNUSGvV3W3tFLWg转载于:https://www.cnblogs.com/yongfuxue/p/10355537.html

2019-02-07 21:02:00 99

转载 spark-streaming学习笔记-2019.02.07学习笔记

https://pan.baidu.com/s/1bOId4n_DsSn05ehrT5LjUQ转载于:https://www.cnblogs.com/yongfuxue/p/10355534.html

2019-02-07 21:00:00 121

转载 spark-SQL学习笔记-2019.02.07更新

https://pan.baidu.com/s/1UPp1JxNlXcwx7P1-fN11aw转载于:https://www.cnblogs.com/yongfuxue/p/10355530.html

2019-02-07 20:59:00 109

转载 Storm学习笔记-2019.02.07更新

https://pan.baidu.com/s/1TCgw3PiIywxIVk90zEVZYQ转载于:https://www.cnblogs.com/yongfuxue/p/10355516.html

2019-02-07 20:51:00 71

转载 Hbase学习笔记-2019.02.07更新

https://pan.baidu.com/s/1pl-z7qEHaDl8mQi7XcGw2g转载于:https://www.cnblogs.com/yongfuxue/p/10355509.html

2019-02-07 20:46:00 89

转载 ZooKeeper,Hive,Flume,Oozie等学习笔记-2019.02.07更新

https://pan.baidu.com/s/1TN88phKJKN9yxbmrUBZ2JA转载于:https://www.cnblogs.com/yongfuxue/p/10355504.html

2019-02-07 20:41:00 107

转载 hdfs, mapreduce学习笔记-2019.02.07更新

https://pan.baidu.com/s/1OZyegORI3CYhHYdHrWTSiw转载于:https://www.cnblogs.com/yongfuxue/p/10355499.html

2019-02-07 20:39:00 83

转载 Scala学习笔记-2019.02.07更新

https://pan.baidu.com/s/10Ff672zBhCo9XLdPys4DCA转载于:https://www.cnblogs.com/yongfuxue/p/10355485.html

2019-02-07 20:30:00 94

转载 Java学习笔记-2019.02.07更新

https://pan.baidu.com/s/1GuPHFK3a6NMzJJOu5pW4jQ转载于:https://www.cnblogs.com/yongfuxue/p/10355481.html

2019-02-07 20:29:00 78

转载 C语言学习笔记-2019.02.07更新

https://pan.baidu.com/s/1_feehVS_Eo1p_dt-hDMWog转载于:https://www.cnblogs.com/yongfuxue/p/10355476.html

2019-02-07 20:28:00 68

转载 C++学习笔记

https://pan.baidu.com/s/1i_NtMaKUFHDOnTDsS7dq1g转载于:https://www.cnblogs.com/yongfuxue/p/10355475.html

2019-02-07 20:27:00 84

转载 机器学习数学基础-2019.02.07更新

https://pan.baidu.com/s/1M0FKUZz-1MsJ_6yW1VvMqQ转载于:https://www.cnblogs.com/yongfuxue/p/10355470.html

2019-02-07 20:25:00 90

转载 python与常用模块pandas,numpy,matplotlib等库学习笔记-2019.02.07更新

https://pan.baidu.com/s/11uJpgGjZgqDU6Q00YMH-7w转载于:https://www.cnblogs.com/yongfuxue/p/10355453.html

2019-02-07 20:14:00 179

转载 Linux学习笔记-2019.02.07更新

https://pan.baidu.com/s/1ORX6OFUJlkgF8SohCYD7wg转载于:https://www.cnblogs.com/yongfuxue/p/10355452.html

2019-02-07 20:10:00 70

转载 机器学习理论与应用完整学习笔记-2019.02.07更新

https://pan.baidu.com/s/1PhwOfSXXCAKPdpTW4CQdJw转载于:https://www.cnblogs.com/yongfuxue/p/10355447.html

2019-02-07 20:07:00 142

转载 协同过滤、word2vec、LFM

https://pan.baidu.com/s/19BLI4Z2inDCEe2Mm9xq82A转载于:https://www.cnblogs.com/yongfuxue/p/10119079.html

2018-12-14 14:01:00 219

转载 文本摘要生成(seq2seq)

https://pan.baidu.com/s/1Qgyx_2vJirKAcX2HxYuCwA转载于:https://www.cnblogs.com/yongfuxue/p/10119067.html

2018-12-14 13:59:00 1456

转载 文本生成

https://pan.baidu.com/s/1E-V4Y0mNwdoqbKmmo61wdw转载于:https://www.cnblogs.com/yongfuxue/p/10119059.html

2018-12-14 13:58:00 123

转载 文本分类(词袋、tf-idf)

https://pan.baidu.com/s/1Ex0qncu5EwfEIb_BPHX7ZA转载于:https://www.cnblogs.com/yongfuxue/p/10119049.html

2018-12-14 13:57:00 219

转载 文本分类(word2vec)

https://pan.baidu.com/s/1p-p7WrVLUAJl6HB54naBQA转载于:https://www.cnblogs.com/yongfuxue/p/10119048.html

2018-12-14 13:56:00 713

转载 文本分类(CNN)

https://pan.baidu.com/s/1PwCdJtymfzcH451vBJH1aw转载于:https://www.cnblogs.com/yongfuxue/p/10119042.html

2018-12-14 13:55:00 92

转载 词云制作、关键词提取

https://pan.baidu.com/s/1knhSueaRDEE5GpyC_7nWCA转载于:https://www.cnblogs.com/yongfuxue/p/10119034.html

2018-12-14 13:54:00 1308

转载 Fasttext

1、fasttext是facebook开源的一个词向量与文本分类工具,在学术上没有太多创新点,好处是模型简单,训练速度非常快。简单尝试可以发现,做出来的结果也不错,可以达到上线使用的标准。2、简单说来,fastText做的事情,就是把文档中所有词通过lookup table变成向量(word2vec),取平均后直接用线性分类器得到分类结果。fastText和deep av...

2018-12-14 13:50:00 79

转载 CNN做文本分类

转载于:https://www.cnblogs.com/yongfuxue/p/10119009.html

2018-12-14 13:49:00 91

转载 tf.contrib.learn.preprocessing.VocabularyProcessor

tflearn的VocabularyProcessor用法:建立中文词汇表和把文本转为词ID序列tf.contrib.learn.preprocessing.VocabularyProcessor(max_document_length, min_frequency=0, vocabulary=None, tokenizer_fn=None)max_document_len...

2018-12-14 13:48:00 305

转载 对文本抽取词袋模型特征

from sklearn.feature_extraction.text import CountVectorizervec = CountVectorizer( analyzer='word', # tokenise by character ngrams max_features=4000, # keep the mo...

2018-12-14 13:47:00 234

转载 jieba分词

分词算法1.基于前缀词典实现高效的词图扫描,生成句子中汉字所有可能成词情况所构成的有向无环图 (DAG)2.采用了动态规划查找最大概率路径, 找出基于词频的最大切分组合3.对于未登录词,采用了基于汉字成词能力的 HMM 模型,使用了 Viterbi 算法分词分词功能主要有两个方法 jieba.cut 和 jieba.cut_for_sea...

2018-12-14 13:46:00 117

转载 家用电器用户行为分析与事件识别

目标1、根据热水器采集到的数据,划分一次完整用水数据。2、在划分好的一次完整用水事件中,识别出洗浴事件。数据预处理1、原始数据集太大,进行数据抽取2、由于热水器采集的用水数据属性较多,我们只选择与分析目标相关的属性。3、如何划分一次完整的用水事件呢?如果水流量为0的状态记录之间的时间间隔超过一个阈值T,则从该段水流量为...

2018-12-13 19:42:00 1169

转载 基于水色图像的水质评价

目标利用图像处理技术,通过水色图像实现水质的自动评价分析方法与过程需要对图像提取特征,图像特征提取的效果直接影响到图像的识别和分类的好坏。图像特征主要包括颜色特征,纹理特征,形状特征和空间关系特征。与几何特征相比,颜色特征更为稳健,对于物体的大小和方向均不敏感,表现出较强的鲁棒性。本案例中水色图像是均匀的,故主要关注颜色特征。利用图...

2018-12-13 19:40:00 1362

转载 中医证型关联规则挖掘

挖掘目标1、借助三阴乳腺癌患者的病理信息,挖掘患者的症状与中医证型之间的关联关系(关联规则算法)2、对截断治疗提供依据,挖掘潜性证素数据预处理1、属性规约本案例收集的数据共73个属性,我们只选择6中证型得分、TNM分期的属性值构造数据集2、数据变换1)属性构造为了更好的反映出中医证素分布的性质,使用证型系数来...

2018-12-13 19:39:00 725

转载 航空公司客户价值分析

实现目标1)借助航空公司客户数据,对客户进行分类2)对不同的客户类别进行特征分析,比较不同类客户的客户价值。3)对不同价值的客户类别提供个性化服务,制定相应的营销策略。分析方法和过程传统的客户价值识别的3个指标:时间间隔,消费频率,消费金额。而相同消费金额的客户对航空公司来说可能是有不同价值的,如长航线低等级舱和短航线高等舱。因此我们选择客户在一...

2018-12-13 19:38:00 314

转载 电力窃漏电用户自动识别

目标系统中的用电负荷不能直接体现出用户的窃漏电行为,终端报警存在很多误报和漏报的情况,因此需要进行数据探索和预处理。总结窃漏电用户的行为规律,再从数据中提炼出描述窃漏电用户的特征指标,最后结合历史窃漏电用户信息,整理出识别模型的专家样本数据集。数据探索分析1、分布分析根据用户类别查看窃漏电用户数的分布情况,一些类别不会出现窃漏电情况,那么直接将这个类别的用户从...

2018-12-13 19:37:00 444

转载 信息论基础

信息论基础信息i(x) = -log(p(x))如果说概率p是对确定性的度量那么信息就是对不确定性的度量独立事件的信息如果两个事件X和Y独立,即p(xy)=p(x)p(y) ,假定X和y的信息量分别为i(x)和i(y),则二者同时发生的信息量应该为i(x^y)=i(x)+i(y)熵:自信息的期望熵是对平均不确定性的度量对熵的理解...

2018-12-12 13:18:00 284

转载 Xgboost

Xgboost优势1、正则化标准GBM的实现没有像XGBoost这样的正则化步骤。正则化对减少过拟合也是有帮助的。2、并行处理XGBoost可以实现并行处理,相比GBM有了速度的飞跃。3、缺失值处理XGBoost内置处理缺失值的规则。用户需要提供一个和其它样本不同的值,然后把它作为一个参数传进去,以此来作为缺失值的取值。XGBoos...

2018-12-12 13:08:00 139

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除