提高开源项目逼格-为你的github项目添加Travis CI

1.背景                每当我们浏览github开源项目的时候,比较牛的项目,往往在readme文件里,会有如下图这样的小绿标。因为博主的好奇心比较强,所以就研究了下怎么添加这个。大家也不妨动手试试!2.步骤         (1)登陆以下网站,它会自动绑定你的github账号-https://travis-ci.org/          (2)会自动生成你的所有repo的列表,...
阅读(2473) 评论(0)

Todd.log - a place to keep my thoughts on programming TF-IDF模型的概率解释

转自:http://www.cnblogs.com/weidagang2046/archive/2012/10/22/tf-idf-from-probabilistic-view.html信息检索概述信息检索是当前应用十分广泛的一种技术,论文检索、搜索引擎都属于信息检索的范畴。通常,人们把信息检索问题抽象为:在文档集合D上,对于由关键词w[1] ... w[k]组成的查询串q,返回一个按查询q和文...
阅读(1316) 评论(0)

新闻个性化推荐系统(python)-(附源码 数据集)

1.背景       最近参加了一个评测,是关于新闻个性化推荐。说白了就是给你一个人的浏览记录,预测他下一次的浏览记录。花了一周时间写了一个集成系统,可以一键推荐新闻,但是准确率比较不理想,所以发到这里希望大家给与一些建议。用到的分词部分的代码借用的jieba分词。数据集和代码在下面会给出。2.数据集一共五个字段,以tab隔开。分别是user编号,news编号,时间编号,新闻标题,对应当前月份的日...
阅读(9483) 评论(20)

写给师弟师妹的一封信-论在校程序员的学习方向

这是我给研究生刚入学的师弟师妹们的一封信,分享给大家吧Hi dear team-members:                  我们的项目已经接近尾声,过一段我会去成都把项目部署完成。感谢大家这段时间的辛苦工作。         发这个邮件的原因,是我不知道大家是否在等待我来部署任务,或是可以自主的学习。         首先我想说的事情是,不要指望做好实验室的项目就会找到好的工作;不要指望在...
阅读(2179) 评论(3)

【问底】严澜:数据挖掘入门——分词

谷歌4亿英镑收购人工智能公司DeepMind,百度目前正推进“百度大脑”项目,腾讯、阿里等各大巨头也在积极布局深度学习。随着社会化数据大量产生,硬件速度上升、成本降低,大数据技术的落地实现,让冷冰冰的数据具有智慧逐渐成为新的热点。要从数据中发现有用的信息就要用到数据挖掘技术,不过买来的数据挖掘书籍一打开全是大量的数学公式,而课本知识早已还给老师了,着实难以下手、非常头大!我们不妨先跳过数学公式,看...
阅读(1933) 评论(1)

[置顶] Android系统截屏的实现(附代码)

1.背景           写博客快两年了,写了100+的文章,最火的文章也是大家最关注的就是如何实现android系统截屏。其实我们google android_screen_shot就会找到很对办法,但那些都是很多年前的了,在android4.*版本后,android对于源码进行了更正,使得以前的方法都不能够使用。       感谢cjd6568358这名网友,我们一起讨论,最终由他实现了a...
阅读(16298) 评论(43)

ospaf-开源项目成熟度分析工具

1.概述软件成熟度评估的最终目标是帮助软件的可持续发展,并为用户应用提供必要的技术参考。开放源代码软件成熟度评估也不例外。我们通过软件的成熟度评估,形成全面的涉及技术、应用、法律等层面的评价报告,帮助那些正在或潜在的开源软件使用者准确的了解软件的技术特性和应用特性,从而为他们选择适合自身需求的开源软件提供参考。同时报告中涉及的大量评测数据,为开源软件的开发者提供帮助,促进他们有效的改善软件在技术方...
阅读(2127) 评论(0)
    我的微信公众号

    作者公众号:凡人机器学习

    凡人机器学习

    机器学习微信交流群
    为了方便大家学习与交流,凡人云近日已开通机器学习社群! 分享“凡人机器学习”公众号名片到40人以上的大群并截图给小助手,小助手就会拉你入群 在这里你可以得到: 1.各种学术讨论 2.最新的资料分享 3.不定期的征文以及联谊活动! 小助手微信号:meiwznn
    作者新书《机器学习实践应用》

    主要讲述算法和业务的结合,适合初学者

    机器学习实践应用

    京东地址

    个人资料
    • 访问:757043次
    • 积分:10366
    • 等级:
    • 排名:第1805名
    • 原创:226篇
    • 转载:39篇
    • 译文:0篇
    • 评论:452条
    博客专栏
    统计