![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器学习
文章平均质量分 80
彭笳鑫
Apache Committer,对数据库和网络有一定的了解,喜欢参加一些比赛
2022 云原生编程挑战赛 2 和 ECS CloudBuild 开发者大赛赛道 3 【季军】
PingCap 性能挑战赛 【亚军】
蚂蚁绿色计算第一赛道 【第二名】
其他若干比赛 Top5,Top10 等
展开
-
[机器学习] 看了一下KNN的介绍,那么动手做一个简单的例子
KNN分类算法 KNN是一种比较容易的分类算法,俗称K邻值算法,是一种挺容易理解监督式算法。原创 2015-11-06 16:24:16 · 2682 阅读 · 0 评论 -
用Python开始机器学习(5:文本特征抽取与向量化)
在原文的基础上增加点笔记,stop_word的增加方法。转载 2015-11-16 16:40:54 · 871 阅读 · 0 评论 -
ROC曲线判别线性回归,java实现。
ROC曲线只能用来判断逻辑二元类的模型,如果线性方面的话得定阈值来判断。我自己写了个java小例子,考虑的不全。原创 2016-05-25 17:38:58 · 2830 阅读 · 0 评论 -
[机器学习] 聚类算法的轮廓系数,java实现
这次实现一个轮廓系数(wiki, baidu)。目的是为了评估聚类效果的好坏。我比较推荐大家观看wiki的说法,百度里面的有些说的不是很明白,比如百度百科中的这句话就很费劲 (计算 b(i) = min (i向量到所有非本身所在簇的点的平均距离))下面是wiki的轮廓系数的说明,大体说一下我的理解: a(i)是中心点到自己cluster中的平均距离。b(i)是中心点到其他c原创 2016-09-13 14:43:13 · 3741 阅读 · 0 评论 -
[spark] mllib决策树通过Strategy修改内存,java实现
java实现Strategy修改决策树的内存大小原创 2016-09-02 09:17:39 · 1058 阅读 · 0 评论 -
[数据竞赛] 基于人工智能的分子筛选竞赛思路,a榜十一,b榜第十
任务: 2014年,一种未知的疾病在全球肆虐,让人类束手无策。致病蛋白质很多,它们的结构序列都藏在df_protein.csv 数据集中(Sequence特征)。经过科学家的不懈努力,能与这些致病蛋白相结合的小分子(df_molecule.csv中的Fingerprint特征表示了其结构)也被发现,并附上了它们的理化属性。此外,在df_affinity.csv数据集中,包含了蛋...原创 2018-05-27 21:27:34 · 1531 阅读 · 8 评论