自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 收藏
  • 关注

原创 RNN_lstm 循环神经网络 - 回归任务

Github:https://github.com/yjfiejd/Tensorflow_leaning/blob/master/tensorflow_20.3_RNN_lstm_regression.py# -*- coding:utf8 -*-# @TIME : 2018/4/30 下午2:35# @Author : Allen# @File : tensorflow_20.3_RNN_...

2018-04-30 19:02:35 3695

原创 RNN_lstm 循环神经网络 - 分类任务

Github:https://github.com/yjfiejd/Tensorflow_leaning/blob/master/tensorflow_20_RNN_lstm%20循环神经网络.py# -*- coding:utf8 -*-# @TIME : 2018/4/30 上午11:34# @Author : Allen# @File : RNN_lstm 循环神经网络.py#参考...

2018-04-30 14:13:09 756

原创 Kaggle - Home Depot Product Search Relevance 进阶篇

Github: https://github.com/yjfiejd/Product_search_relevance_NLP-/blob/master/product_search_relevance_advanced.ipynb (可查看jupyter notebook)基础篇与进阶篇最大的区别:特征提取的方式不同基础篇中特征的提取太粗糙:1)关键字常长度 2)用搜索词中的单词在产品title...

2018-04-27 16:22:22 662 1

原创 Kaggle - Home Depot Product Search Relevance 基础篇

Predict the relevance of search results on homedepot.comkaggle 地址:https://www.kaggle.com/c/home-depot-product-search-relevanceGithub:https://github.com/yjfiejd/Product_search_relevance_NLP-/blob/maste...

2018-04-27 03:30:34 1082 3

原创 Kaggle_Daily News for Stock Market Prediction_进阶篇

进阶篇与基础篇的区别是:采用了Word2Vec方法,自己构建语料库迅雷NLP模型Github:  https://github.com/yjfiejd/News_predict 需要补充的知识点:#需要学习的:#numpy.ndarray.flatten https://docs.scipy.org/doc/numpy/reference/generated/numpy.ndarray.flat...

2018-04-24 22:31:13 896

原创 Kaggle_Daily News for Stock Market Prediction_基础篇

Daily News for Stock Market Prediction: https://www.kaggle.com/aaron7sun/stocknews/version/【Github】: https://github.com/yjfiejd/News_predict (可下载数据与python文件)通过历史数据:包含每日点击率最高的25条新闻,与当日股市涨跌,来预测未来股市涨跌(请勿...

2018-04-24 16:44:45 1278 1

原创 自然语言处理学习 - NLTK 预热篇

 NLTK 在NLP上的经典应用: 情感分析、文本相似度、文本分类【转载】NLTK 基本功能介绍:python的nltk中文使用和学习资料汇总帮你入门提高 - 作者:糊糊 文本处理的流程 TF-IDF 的学习1) 自带语料库的使用:#自带语料库使用from nltk.corpus import brownbrown.categories()['adventure', 'belles_let...

2018-04-20 17:11:04 251

原创 自然语言处理学习 - Word2vec基础数学篇

【转载】机器学习算法实现解析——word2vec源码解析 --- 作者:zhiyong_will【转载】word2vec 中的数学原理详解(一)目录和前言 --- 作者:peghoty【转载】word2vec数学原理 【转载】word2vec有什么应用?--- 来自知乎各位大牛现身说法【转载】[NLP] 秒懂词向量Word2vec的本质 --- 知乎穆文『数据挖掘机养成记』【转载】word2vec...

2018-04-20 08:02:27 280

原创 Kaggle - House_Price进阶篇幅

进阶篇:主要是在建模上与基础篇不同,基础篇使用ridge,进阶篇使用Bagging , Adaboosting, XGboostingGithub: https://github.com/yjfiejd/House_price_basic_practice/blob/master/.ipynb_checkpoints/back_up_pycharm-checkpoint.ipynb基本流程:#【1...

2018-04-16 13:10:02 877 1

原创 Kaggle - House_Price基础篇

Kaggle - House price 数据处理Kaggle: House Prices: Advanced Regression Techniques1,读取数据: 使用pd.read_csv()导入 train_df, test_df数据2,合并数据: label:  使用log1p平滑处理train_df中的label得到[y_train] -> 最后需要用expm1() 变回来提取...

2018-04-14 17:56:44 1367

原创 聚类算法 - KMeans - 机器学习实战

直接上代码:https://github.com/yjfiejd/k-means_3# -*- coding:utf8 -*-# @TIME : 2018/4/12 下午05:33# @Author : yjfiejd# @File : K-means_3.pyfrom numpy import *import timeimport matplotlib.pyplot as plt...

2018-04-13 07:17:21 434

原创 聚类算法- Kmeans and DBSCAN

基础知识:【转载】:深入理解K-Means聚类算法 _  转自:CSDNyqtaowhu【转载】:第十三篇:K-Means 聚类算法原理分析与代码实现 转自:花名穆晨【转载】:聚类算法——python实现密度聚类(DBSCAN)Github地址:https://github.com/yjfiejd/k-means_2 k-means伪代码:1 创建 k 个点作为起始质心 (随机选择):2 ...

2018-04-12 02:12:09 1009

原创 聚类算法Kmeans - Scikit learn

练习代码放在了github:https://github.com/yjfiejd/K-means_1/tree/master练习:Scikit-learn --- clustering参考:http://scikit-learn.org/stable/modules/clustering.html#clustering# -*- coding:utf8 -*-# @TIME : 2018/4/1...

2018-04-11 21:40:57 620

转载 机器学习算法中GBDT和XGBOOST的区别有哪些?

【转载】:机器学习算法中GBDT和XGBOOST的区别有哪些? 作者:wepon

2018-04-10 22:14:52 192

原创 聚类算法_基础篇

为了后续方便复习,目前先记录下聚类算法中背后的数学原理,后期需配合《西瓜书》《统计学习方法》《机器学习实战》食用Blending & bagging主要介绍了blending和bagging的方法,它们都属于aggregation,即将不同的gt合并起来,利用集体的智慧得到更加优化的G(t)。Blending通常分为三种情况:Uniform Blending,Linear Blending...

2018-04-10 15:47:20 236

原创 SVM - 基础知识篇2

今天复习SVM内容两部分,数学推导公式如下(方便自己复习):Soft-Margin Support Vector MachineKernel Logistic RegressionSoft-Margin Support Vector MachineSoft-Margin Support Vector Machine...

2018-04-08 17:09:33 150

原创 SVM - 基础篇Sklearn

SVM的基本思想训练一个简单SVM模型调节SVM参数:Soft margin问题:调节C参数、伽马γ参数下一次补充SMO算法的学习基本知识补充#【基本知识补充】#random_state参数:https://blog.csdn.net/yangyiwxl/article/details/71641355#numpy.random.RandomState函数用法:https://blog.csd...

2018-04-08 00:15:41 424

原创 SVM - 基础知识篇

基础知识篇:转:支持向量机(SVM)是什么意思? (挺好玩,又超简单的解释)转:【直观详解】支持向量机SVM转:SVM with polynomial kernel visualization (07年的视频,一针见血)转:机器学习技法 Machine Learning Techniques (看了几遍,感觉很舒畅)下一张图片转自知乎用户:靠靠靠谱数学自己推导篇(方便自己复习使用)SVM线性SVM...

2018-04-05 14:30:48 506

原创 贝叶斯 - 新闻分类

GitHub : https://github.com/yjfiejd/Bayes_News_Classification/tree/master (可下载数据与代码)基础知识储备:导入常用python package导入文章content,导入停用词表使用jieba对content内容分词创建函数去除content中的停用词(注意格式的不同 dataframe, series, list)统计词...

2018-04-02 22:30:18 1503 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除