OverTheMoon
码龄11年
关注
提问 私信
  • 博客:33,614
    33,614
    总访问量
  • 28
    原创
  • 1,855,918
    排名
  • 3
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2014-07-08
博客简介:

啦啦啦

查看详细资料
个人成就
  • 获得1次点赞
  • 内容获得1次评论
  • 获得10次收藏
创作历程
  • 1篇
    2022年
  • 2篇
    2021年
  • 6篇
    2019年
  • 5篇
    2018年
  • 14篇
    2017年
成就勋章
兴趣领域 设置
  • 人工智能
    深度学习nlp
创作活动更多

2024 博客之星年度评选报名已开启

博主的专属年度盛宴,一年仅有一次!MAC mini、大疆无人机、华为手表等精美奖品等你来拿!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

python pickle 保存读取文件

.
原创
发布博客 2022.11.08 ·
723 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

细枝末节算法整理

算法索引Naive BayesAutoEncoderNaive BayesIt is a classification technique based on Bayes’ Theorem with an assumption of independence among predictors.P(c∣x)=P(x∣c)P(c)P(x)P(c|x) = \frac{P(x|c)P(c)}{P(x)}P(c∣x)=P(x)P(x∣c)P(c)​, where c is the target and x is
原创
发布博客 2021.07.02 ·
219 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

第二次刷题整理

establish dp listsdp = [[0]*n for _ in range(n)]usage of range:range(5) means range(0,5,1)if you want to reverse it, use range(0, 5, -1)if there is boundary for output:if result>=-2**31 and result<= 2**31 -1: return resultelse: return
原创
发布博客 2021.01.16 ·
205 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

深度学习结构相关

Deep LearningRNNStandard RNNLSTMAttentionSelf-attentionMulti-head AttentionCNNText-CNNTransformerBERTRNNStandard RNNLSTMhttp://colah.github.io/posts/2015-08-Understanding-LSTMs/AttentionAttentio...
原创
发布博客 2019.10.30 ·
443 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

推荐系统与联邦学习

推荐系统与联邦学习基于流行度的推荐算法汤普森采样基于协同过滤的推荐算法(UserCF与ItemCF)基于内容的推荐算法基于模型的推荐算法基于混合式的推荐算法基于流行度的推荐算法基于流行度的算法非常简单粗暴,类似于各大新闻、微博热榜等,根据PV、UV、日均PV或分享率等数据来按某种热度排序来推荐给用户。注:独立访客(UV)、访问次数(VV)两个指标有什么区别?① 访问次数(VV):记录1天内...
原创
发布博客 2019.10.30 ·
1870 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

chatbot笔记

Chatbotpaper scriptCoChat: Enabling Bot and Human Collaboration for Task Completionpaper scriptCoChat: Enabling Bot and Human Collaboration for Task Completion先用supervised learning做个inialization,之后...
原创
发布博客 2019.06.20 ·
239 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

An introduction to reinforcement learning

Having taken a quick look at several overviews of reinforcement learning, I wrote a script here to conclude and take down some key concepts and points to help myself understand the reinforcement learn...
原创
发布博客 2019.06.07 ·
937 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

面试题收录

面试题收录模型篇回归树和分类树二元分类器功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入模型篇这里收录了单个模型和多...
原创
发布博客 2019.04.12 ·
485 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Python 特征工程

1. LabelEncoder简单来说 LabelEncoder 是对不连续的数字或者文本进行编号from sklearn.preprocessing import LabelEncoderle = LabelEncoder()le.fit([1,5,67,100])le.transform([1,1,100,67,5])输出: array([0,0,3,2,1])2. O...
原创
发布博客 2019.01.31 ·
528 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

如何向外行解释一个黑盒模型

http://blog.datadive.net/interpreting-random-forests/https://github.com/andosa/treeinterpreterhttps://www.kaggle.com/learn/machine-learning-explainability 2019/02/20复盘今天和业务讲了IsolationForest异常...
原创
发布博客 2018.11.13 ·
2401 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

时间戳的使用

python中时间戳的使用 import timex = '2019/9/5'# change the string time into binlog timetime.mktime(time.strptime(x, '%Y/%m/%d'))y = 1567612800# change the binlog time into stringtime.strftime(...
原创
发布博客 2018.09.27 ·
788 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

调参感悟

1. GridSearchCV注意这边有一个坑,样本划分方法不是KFold,而是Stratified KFold 我的朋友写了一个sample generator来解决这个问题:from sklearn.model_selection import KFoldmyCV = []for train_index, test_index in KFold(5,shuffle=Tru...
原创
发布博客 2018.08.15 ·
415 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

算法导论-初涉

1. 对字典的value做排序,同时输出字典的keyfre_dict = dict()sorted(fre_dict.items(), key = lambda x: x[1])sorted(fre_dict.keys(), key=lambda x:(fre_dict[x],x))2. 统计一个列表里各个元素的出现次数 O(n)from collections import...
原创
发布博客 2018.06.02 ·
304 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

关于Git

今天第一次使用了一下先下载一个Git到本地。然后在想要放Git工程的地方,右键bash然后是一些命令:gitclone<地址>#新建分支gitcheckout-b<branch_name>#修改后gitadd--allgitcommit-m"somecomments"gitpushorigin<branch...
原创
发布博客 2018.03.07 ·
197 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

一些shell语句

三脚猫功夫。日常记录一下遇到的语句。ls -l 打印该目录下所有文件的信息 cp -R /notebook/yuke/models/* /notebook/models/yuke 把右侧文件夹里所有文件复制到右边目录下 mkdir yuke 在该目录下创建新文件夹 pwd 查看现在的目录 ln -s /notebook/models...
原创
发布博客 2017.12.26 ·
292 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

LR的变量选择问题

Python中没有forward backward stepwise方法。使用RFE包原理:参数中设定需要几个变量,每次按重要性筛去变量参考:http://scikit-learn.org/stable/modules/generated/sklearn.feature_selection.RFE.html心得:可以考虑使用gridsearch来调节n_features
原创
发布博客 2017.12.20 ·
879 阅读 ·
0 点赞 ·
0 评论 ·
3 收藏

一些统计量

皮尔森相关系数斯皮尔曼相关系数皮尔森卡方统计量· 用于衡量两个categorical variables的关联性,其来自于列联表中的频率数似然比检验统计量F检验· 衡量的是一个连续变量和一个名义变量之间的关联性基尼方差· 三种情况:1)一个连续变量和一个名义或顺序变量;2)两个名义变量;3)两个顺序变量熵方差
原创
发布博客 2017.12.06 ·
421 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

imbalanced_learn包的使用小记

文档在此http://contrib.scikit-learn.org/imbalanced-learn/stable/这一次是使用了under-sampling。样本比例大约200:1# Resampledfrom imblearn.under_sampling import RandomUnderSamplerrus = RandomUnderSampler(ran
原创
发布博客 2017.12.01 ·
6288 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

Python建模的一些通用操作

1. 训练集测试集划分from sklearn.cross_validation import train_test_splitx_train, x_test, y_train, y_test = train_test_split(x_data, y_data, test_size = 0.2, random_state = 45)2. cross...
原创
发布博客 2017.11.30 ·
714 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Pandas的基本操作

基本都是关于DataFrame的1. 读取数据score_df = pd.read_csv('D:\\task1\Data\cleaned\\text', sep='\t', header=None)不写header表示列名为第一行注意地址中有转义字符的话需要双斜杠。比如'\t''\r'.2. 更改、添加列名score_df.colum...
原创
发布博客 2017.11.30 ·
305 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏
加载更多