- 博客(8)
- 资源 (6)
- 收藏
- 关注
原创 hive交互行中输入sql代码会出现 Display all 475 possibilities? (y or n)
解决在hive交互行中输入sql代码会出现 Display all 475 possibilities? (y or n)原因是因为粘贴的sql中含有tab,把tab换成空格就行了目标:将sql代码中的tab转换成空格...
2019-08-26 16:57:14 756
原创 python 局域网传文件
1.WIN+R2.跳到G盘 tmp目录下G:cd tmp3.python -m http.server 80014.http://127.0.0.1:8001/
2019-08-06 20:54:25 392
原创 用kodexplorer可道云在本地搭建私有云
https://jingyan.baidu.com/article/bea41d43b5d9ffb4c41be65a.htmlPort 80 in use by "Unable to open process" with PID 4!net stop was /y 即可搞定
2019-08-06 20:54:13 1217
原创 数据挖掘和机器学习工程师面试题积累
常见的损失函数?决策树的剪枝?集成学习?boosting和bagging区别偏差和方差为什么增加数据可以降低过拟合?过拟合和欠拟合?过拟合和欠拟合对偏差和方差的影响?过拟合以及各类情况下过拟合的解决措施?梯度消失和剃度爆炸常见的深度学习优化器激活函数有哪些线性回归和逻辑回归准确率和召回率的决策树的类型以及介绍?正则化讲讲逻辑回归模型?讲讲gbdt模型?讲讲xgb...
2019-08-06 20:53:26 445
原创 学习腾讯的NLP文本分类
背景:照例先说背景,笔者是O厂数据挖掘工程师一枚,负责广告标签挖掘工作,实质就是给广告主大大找最适合投放广告的一批手机用户,考核指标主要有点击率CTR、下载率、注册率、首日ROI(就是当天用户注册充值的金额比上广告主大大的成本)等。我们的数据源主要有app、咨询、url、ad和query。拿app来说,我们有用户使用app的数据。这样user-app表有了,然后我们构建标签体系生成app-tag表...
2019-08-04 16:13:59 1195 1
原创 github 资源整理
https://github.com/Smilexuhc/Data-Competition-TopSolutionData competition Top Solution 数据竞赛Top解决方案开源整理https://github.com/Tencent/NeuralNLP-NeuralClassifier腾讯文本分类NLP...
2019-08-04 10:35:43 376
原创 工作中用到的hadoop命令集合
--创建hdfs目录hadoop fs -mkdir /tmp/liushumingsql("""select dayno,search_word,count(1) as serch_num from dw.f_evt_browser_search_detaily where dayno>=20190521 and dayno<=20190527 gro...
2019-08-01 15:58:06 212
原创 python re 匹配案例
# -*- coding: utf-8 -*-import reif __name__=="__main__": url = "https://m.weibo.cn/u/1941025111?uid=1941025111&luicode=10000011&lfid=1005051941025111" matchobj=re.match(r"(.*)?uid...
2019-08-01 11:17:03 740
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人