数据挖掘
哈哈进步
Had i not seen the sun, i could have borne the shade.
展开
-
数据挖掘第一课学习笔记(Apriori算法和FPTree算法)
首先明确关联规则挖掘中的几个概念定义:假设有数据集表示几个客户买的东西如下:t1: 牛肉、鸡肉、牛奶t2: 牛肉、奶酪t3: 奶酪、靴子t4: 牛肉、鸡肉、奶酪t5: 牛肉、鸡肉、衣服、奶酪、牛奶t6: 鸡肉、衣服、牛奶t7: 鸡肉、牛奶、衣服ti表示不同的客户在一次购物中买的东西,那么:事务&事务集合:每次顾客购买的一次商品集合ti就称作一个事务,所有的T={原创 2016-03-22 15:40:45 · 4395 阅读 · 0 评论 -
kaggle的toxic_comment_classification比赛21th经验总结
这个比赛可以说是一波三折,本来应该早早就结束了,结果因为数据泄露更换了数据,中途还更换过评价指标,不过好在最后还是顺利结果,我们队伍拿到了前1%的成绩(21/4551),属于不是很好但是也不是很坏的结果,这是我第一次在kaggle上完整的参与一个NLP比赛,因此我感觉有必要将这次的比赛经历写下来,做一个总结。比赛链接:点击打开链接1.数据分析(EDA)1)查看数据,训练数据159571 条,测试数...原创 2018-03-22 14:19:24 · 5712 阅读 · 7 评论 -
Keras中Conv1D和Conv2D的区别
如有错误,欢迎斧正。我的答案是,在Conv2D输入通道为1的情况下,二者是没有区别或者说是可以相互转化的。首先,二者调用的最后的代码都是后端代码(以TensorFlow为例,在tensorflow_backend.py里面可以找到):x = tf.nn.convolution( input=x, filter=kernel, dilatio...原创 2018-03-13 01:04:04 · 57929 阅读 · 12 评论 -
编写自己的jupyterhub验证接口
完成jupyterhub的安装以及一些配置,可以参考: 这篇博客 以及官网 还有githubjupyterhub本身支持多种验证,默认为本地的unix用户账号和密码验证,也可以采用很多诸如gitlab或者github账号验证,比如上面提到的博客就是用了gitlab验证(gitlab验证需要先在gitlab里面新建application,application的url填写的地址是就是jup...原创 2018-07-06 16:28:14 · 4780 阅读 · 0 评论