Machine Learning
文章平均质量分 94
sesiria
这个作者很懒,什么都没留下…
展开
-
基于K-Means算法的应用 User Clustering
User Clustering计算出segment对于Recence,先对数据进行排序,然后映射到4个bucket中,数值越大价值越大接着计算对于R的 segment接着对M排序并映射到bucket中,然后计算对应M的Segment接着计算M的segment最后把segment的值相加得到Score最后根据的Score设定规...原创 2019-10-27 10:23:12 · 436 阅读 · 0 评论 -
Algorithm: K-Means
K-MeansThe K-Means is anunsupervised learning algorithm which hasthe input sample data without label.Sometimes we use the CRM system to manage the relationship between the customer. The concept...原创 2019-10-25 09:33:18 · 347 阅读 · 0 评论 -
金融风控项目
一、问题定义金融的核心是风险控制。自然而然地,AI的主战场也变成了如何使用AI技术精准的做风险控制。在风控领域,有一个很重要的问题是:如何通过用户的信息来判断用户的逾期与否?我们通过收集用户的基本信息、地域信息、社交信息等来判断一个人的逾期概率。我们的问题是:基于用户相关的信息来预测此用户是否违约。数据如下:https://www.kesci.com/home/competit...原创 2019-10-18 15:57:34 · 3857 阅读 · 2 评论 -
Algorithm: Boosting model with XGBoost
Difference between bagging and boosting:We call each sub model in ensemble mode as weak learner. In random forest, it is the decision tree.Weak Learner: it can't be used to predict the result in...原创 2019-10-16 19:43:00 · 259 阅读 · 0 评论 -
Chatbot 聊天机器人相关资料
chatbot guide:https://zhuanlan.zhihu.com/p/552016251.retrieval based chatbot:https://zhuanlan.zhihu.com/p/547955452.generation based chatbot:https://blog.csdn.net/irving_zhang/article/details/790...原创 2019-10-15 14:29:27 · 341 阅读 · 0 评论 -
基于集成学习模型的估价预测(量化投资)
股价的预测这个领域属于量化投资,也就是通过数量化的方式和模型去做投资决策。量化投资是一个很庞大的领域,从量化投资开始至今,衍生出了大量的投资理念和策略。纵观国内外量化投资现状,国内其实刚刚起步,还有很长的路要走,这里包括数据的完整性、透明性等。 国内目前散户(个人投资者)很多,但比如像美国这些欧美国家,绝大部分是以机构投资者为主的,而且他们很多都在使用量化投资技术。此项目关注的地方:...原创 2019-10-13 09:28:24 · 1391 阅读 · 0 评论 -
Algorithm: Random Forest, ensemble model
Ensemble ModelFor clasisfication problem the ensemble model is very effective. Such as the situation of the Image recognition via deep learning.(black box)For agrade system, we use the GBDT or X...原创 2019-10-12 14:58:48 · 319 阅读 · 0 评论 -
Algorithm: Decision Tree, Entropy, Information Gain and Continues features
Deciesion Tree is the foundation of the random forest.A decision tree is a decision support tool that uses a tree-like model of decisions and their possible consequences, including chance event outc...原创 2019-10-10 16:06:09 · 440 阅读 · 0 评论 -
搭建情感分析系统,tf-idf,word2vec
情感分析问题给定一个文本并输出它的情感值,情感值无非是正面、负面或者中性。我们希望通过使用一种算法去识别一个文本的情感,这个问题本身属于文本分类问题。 如果只是正面或者负面,就是二分类问题;但如果是正面、负面和中性,则是三分类问题。应用场景:1)量化投资,就是通过AI技术去做投资比如股票买卖。在量化投资里,我们一般使用模型对未来的股市做预测,然后再进行买卖的决策。在这个任务上,我们...原创 2019-10-08 14:30:40 · 1952 阅读 · 0 评论 -
生成模型与判别模型
生成模型生成模型:在概率统计理论中, 生成模型是指能够随机生成观测数据的模型,尤其是在给定某些隐含参数的条件下。它给观测值和标注数据序列指定一个联合概率分布。在机器学习中,生成模型可以用来直接对数据建模(例如根据某个变量的概率密度函数进行数据采样),也可以用来建立变量间的条件概率分布。条件概率分布可以由生成模型根据贝叶斯定理形成简而言之:模型可以生成数据。基于GAN(Generat...原创 2019-10-07 16:36:52 · 257 阅读 · 0 评论 -
Naive Bayesian for Text Classification (MLE, Gaussian Naive Bayesian)
The Naive Bayesian is a baseline for text classification problem.A spam email example. We need to count the frequency of words which occurs in the span/normal email.Such as, ad., purchase, link...原创 2019-10-07 16:18:47 · 470 阅读 · 0 评论 -
项目:广告点击预测率评估
背景:一方面有流量的企业希望最大化广告收益;另一方面需要流量的个体希望最小化广告投放成本但同时最大化效果,这就是一个博弈的过程。目前市面上流行的百度信息流、微信朋友圈投广都是基于这类的博弈过程。你可以设想一下: 假如有几家公司想在百度投放广告,但是广告位是有限的,那这时候该选择哪一家的广告呢? 这里就有一个很关键的概念,叫作竞价!也就是谁出的钱越多,就放谁的, 但这里有一个很重要的前...原创 2019-10-01 11:49:31 · 2091 阅读 · 0 评论 -
Overfitting and Regulization in Machine Learning
Logistic Regression by Sklearnsklearn.linear_model.LogisticRegressionpenalty: l1 ,l2 regulization, elasticent(combine l1, l2) or non(not any regulization)C: the inverse of regulzrization stre...原创 2019-09-30 14:45:49 · 327 阅读 · 0 评论 -
Algorithm: Logistic Regression and Gradient Descent
The most classic model in machine learning : Logistic Regression.Some problems for two class classifyLogistic Regression is a base line for classify problemWhen we design a model for machine...原创 2019-09-29 15:57:35 · 701 阅读 · 0 评论 -
Algorithm: Linear Regression
The Linaer Regression with the properties:the decision boundary is linearit is a regression moedl to predict the value respect to the input data1. visualize the input feature with the related ...原创 2019-09-29 09:33:11 · 271 阅读 · 0 评论 -
Machine Learning - Lecture 01 Class Note
IntroductionWhat is Machine Learning?Two definitions of Machine Learning are offered. Arthur Samuel described it as: "the field of study that gives computers the ability to learn without being exp原创 2018-01-04 21:27:35 · 616 阅读 · 0 评论 -
深度学习:Sigmoid函数与损失函数求导
转载自:在神经网络里经常使用sigmoid做激活函数,它的导数是怎么样求解呢?因为要使用它的导数来计算梯度下降。这个过程如下:1. sigmoid函数:f(z) = 1 / (1 + exp( − z))导数:f(z)' = f(z)(1 − f(z))求导过程如下:关于sigmoid函数在神经网络中的应用:http://blog.csdn.net/zhishengqianjun/article/转载 2018-01-18 10:11:49 · 2702 阅读 · 0 评论 -
转载 : 机器学习实战3-sklearn使用下载MNIST数据集进行分类项目
转载自:https://blog.csdn.net/qq_30815237/article/details/879721101、MNIST数据集本章将使用MNIST数据集,这是一组由美国高中生和人口调查局员工手写的70000个数字的图片。每张图像都用其代表的数字标记。这个数据集被广为使用,因此也被称作是机器学习领域的“HelloWorld”:但凡有人想到了一个新的分类算...转载 2019-04-03 09:44:19 · 1381 阅读 · 0 评论 -
转:如何理解神经网络中的BackPropagation算法
作者:Anonymous链接:https://www.zhihu.com/question/27239198/answer/89853077来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。BackPropagation算法是多层神经网络的训练中举足轻重的算法。简单的理解,它的确就是复合函数的链式法则,但其在实际运算中的意义比链式法则要大的多。要回答题主这个...转载 2019-08-06 15:56:02 · 141 阅读 · 0 评论 -
转:完备的AI学习路线,资源整理
转自:https://mp.weixin.qq.com/s/fUNDdCzJrWBoKYh1tT4gSw1数学数学是学不完的,也没有几个人能像博士一样扎实地学好数学基础,入门人工智能领域,其实只需要掌握必要的基础知识就好。AI的数学基础最主要是高等数学、线性代数、概率论与数理统计三门课程,这三门课程是本科必修的。这里整理了一个简易的数学入门文章:数学基础:高等...转载 2019-08-15 13:59:24 · 925 阅读 · 0 评论 -
Multivariable Calculus:Lagrange multipliers
Let's consider the example of finding the minimum of the function,along the curve (or, subject to the constraint),The functions themselves are fairly simple, on a contour map they look a...原创 2019-09-11 09:47:07 · 290 阅读 · 0 评论 -
Algorithm: k-nearest neighbors and decison boundary(Cross Validation)
KNN Algorithm implementationreference:https://en.wikipedia.org/wiki/K-nearest_neighbors_algorithmfrom matplotlib.colors import ListedColormapfrom sklearn import neighbors, datasetsiris = datas...原创 2019-09-18 14:52:32 · 418 阅读 · 0 评论 -
Image Recognition by KNN Algorithm
Dataset:http://www.cs.toronto.edu/~kriz/cifar.htmlThe CIFAR-10 dataset consists of 60000 32x32 colour images in 10 classes, with 6000 images per class. There are 50000 training images and 10000 te...原创 2019-09-27 15:23:47 · 172 阅读 · 0 评论 -
Algorithm: KNN for Regression Problem
The KNN algorithm can not only used in the classify problem, it also can be used for the value prediction as regression problem.Predict for the salary:such as K = 3calculate the distance betwe...原创 2019-09-27 16:56:09 · 263 阅读 · 0 评论 -
Complexity Analysis and K-D Tree datastructure
Complexity for KNN algorithm and the Optimization for KNN search.Time complexitySpace complexityTime/space complexity for recurssive algorithm.Master theorem for complexity analysis:https://...原创 2019-09-28 11:22:41 · 282 阅读 · 0 评论