- 博客(14)
- 收藏
- 关注
转载 Word Embedding与Word2Vec
http://blog.csdn.net/baimafujinji/article/details/77836142一、数学上的“嵌入”(Embedding) Embed这个词,英文的释义为, fix (an object) firmly and deeply in a surrounding mass, 也就是“嵌入”之意。例如:One of the bullets passed...
2018-05-20 10:46:25 571
转载 编程思想之多线程与多进程(1)——以操作系统的角度述说线程与进程
原文:http://blog.csdn.net/luoweifu/article/details/46595285 作者:luoweifu 转载请标名出处什么是线程什么是线程?线程与进程与有什么关系?这是一个非常抽象的问题,也是一个特别广的话题,涉及到非常多的知识。我不能确保能把它讲的话,也不能确保讲的内容全部都正确。即使这样,我也希望尽可能地...
2018-05-19 16:05:10 175
转载 深度学习环境配置:华硕主板的Win 10 + UEFI + GPT条件下且在SSD + HDD双硬盘下安装Ubuntu+Gtx 1080Ti显卡驱动 + CUDA 9.1 + Cudnn 7.1...
本文写文章日期为2018.03.13 因为买电脑自带了win10系统,自己就没有重新安装win10,而是在原win10环境下分割一个磁盘来安装ubuntu16.04,本人电脑GPU为Gtx 1080Ti显卡,要注意的是显示器连接线是直接与Gtx 1080Ti显卡连接,而不是连接主板上的接口!电脑配置见下图。我的硬盘是双硬盘一个256G的SSD固态...
2018-05-18 10:54:52 2029
转载 What is LightGBM, How to implement it? How to fine tune the parameters?
What is LightGBM, How to implement it? How to fine tune the parameters?Hello,Data Science is the fastest growing field in the world. Everyday there will be a launch of bunch of new algorithm, some of ...
2018-05-11 15:23:17 974
转载 Introductory Guide – Factorization Machines & their application on huge datasets
googletag.cmd.push(function() { googletag.display('div-gpt-ad-1525327567902-0'); });IntroductionI still remember my first encounter with a Click prediction problem. Before this, I had been lear...
2018-05-11 09:38:57 542
转载 Kaggle实战——点击率预估
转载自: http://blog.csdn.net/chengcheng1394/article/details/78940565请安装TensorFlow1.0,Python3.5 项目地址: https://github.com/chengstone/kaggle_criteo_ctr_challenge-前言点击率预估用来判断...
2018-05-08 15:56:27 2591
转载 Sklearn中的CV与KFold详解
关于交叉验证,我在之前的文章中已经进行了简单的介绍,而现在我们则通过几个更加详尽的例子.详细的介绍CV%matplotlib inlineimport numpy as npfrom sklearn.model_selection import train_test_splitfrom sklearn i...
2018-05-08 13:09:51 7002
转载 Python怎么利用多核cpu
原文链接http://www.cnblogs.com/stubborn412/p/4033651.htmlGIL 与 Python 线程的纠葛GIL 是什么东西?它对我们的 python 程序会产生什么样的影响?我们先来看一个问题。运行下面这段 python 程序,CPU 占用率是多少?# 请勿在工作中模仿,危险...
2018-05-06 14:15:26 28686
转载 nohup和&,进程后台运行、查看、终止
nohup 命令可以使命令永久的执行下去,和终端没有关系,退出终端也不会影响程序的运行; & 是后台运行的意思,但当用户退出的时候,命令自动也跟着退出。 那么,把两个结合起来nohup 命令 &这样就能使命令永久的在后台执行以run_train.sh文件为例source env_set.sh...
2018-05-06 10:10:44 3448
转载 如何在关闭ssh连接的情况下,让程序继续在后台运行?
对Unix,Linux类服务器维护经常是通过ssh完成的,而有些操作比较费时,如更新程序等。此时如果断开ssh连接的话,更新程序就会随之被中断。如何保证断开ssh后仍旧能保持更新进程的运行呢?有两种方法: (1)nohup #nohup 应用程序名 & 此后,如果你断开了ssh,程序依旧运行。此种方式的缺点是,应用程序没有交互界面...
2018-05-03 20:32:37 1992 2
转载 sklearn、XGBoost、LightGBM理解与调参
本文主要是针对sklearn,XGBoost,LightGBM的官方文档阅读的一些整理,主要针对sklearn的集成方法、以及gbdt族模型的具体实现差异以及各个模型的重要参数、特点做了一个整理 sklearn集成方法集成方法的目的是结合一些基于某些算法训练得到的基学习器来改进其泛化能力和鲁棒性(相对单个的基学习器而言)主流的两种做法分别是: bagging基本思想独立的训练一些基学习器(...
2018-05-03 13:42:39 4576
转载 sklearn中的fit fit_transform和transfrom区别
数据挖掘通常包括数据采集,数据分析,特征工程,训练模型,模型评估等步骤。使用sklearn工具可以方便地进行特征工程和模型训练工作,在《使用sklearn做单机特征工程》中,我们最后留下了一些疑问:特征处理类都有三个方法fit、transform和fit_transform,fit方法居然和模型训练方法fit同名(不光同名,参数列表都一样),这难道都...
2018-05-03 13:04:37 975
转载 [scikit-learn] 特征二值化编码函数的一些坑
1. 前言2. 问题起源2.1. 对付数值型类别变量2.2. 对付字符串型类别变量2.3. 无用的尝试3. 另一种解决方案4. 参考资料1. 前言这几天埋头撰写『优雅高效地数据挖掘——基于Python的sklearn_pandas库』 一文,其中有一部分涉及如何批量并行地进行特征二值...
2018-05-03 00:04:39 340
转载 主流机器学习模型模板代码+经验分享[xgb, lgb, Keras, LR]
刷比赛利器,感谢分享的人。摘要最近打各种比赛,在这里分享一些General Model,稍微改改就能用的环境: python 3.5.2XGBoost调参大全: http://blog.csdn.net/han_xiaoyang/article/details/52665396 XG...
2018-05-02 23:22:58 2311
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人