- 博客(7)
- 收藏
- 关注
原创 如何在 Excel 里将两部分数据进行横向合并(即 Outer Join)?
不通过编程,实现 Excel 数据的 Outer Join 合并。总体思路是先从两块数据中找出具备相同内容的列作为 Key 列,然后把两块数据的 Key 列内容纵向串接在一起,找出重复值并删除相应的行,既得到 Outer Join 结果。
2021-02-05 13:23:56 4348
原创 用奇异值分解(SVD)方法分析兴趣相似度
如果你和朋友俩人都喜欢看《泰坦尼克》、《西雅图未眠人》、《廊桥遗梦》,但都不爱看《黑客帝国》、《盗梦空间》,那你们之间的兴趣一定很接近。人脑很容易根据一系列“AlikeX”的信息做出直觉的判断,但人脑能处理的数据量太小,也太慢,需要有算法来让计算机也能自动处理这样的兴趣相似度分析。线性代数中的矩阵奇异值分解(Singular Value Decomposition,或SVD)就是这样的算法...
2019-11-24 18:41:27 1297
原创 企业管理软件的未来
曾几何时,企业管理软件是蓬勃发展的IT业皇冠上的明珠,催生了用友、金蝶等一大批明星软件公司。但近几年软件业是夕阳产业的论调不绝于耳,即便是SaaS这种新的产品模式也难入风投的法眼。国内企业经营模式多样,管理软件往往需要大量定制开发,这意味着实施成本居高不下,同时软件本身又很难作为标准化产品批量推广。软件公司大多依赖销售去做客户关系,被“宠坏”的企业客户又会利用其在项目中的绝对发言权来对软件功能“狮...
2019-11-12 10:55:17 1732
原创 利用 NumPy 广播机制提升机器学习运算性能
Python能够力克群雄,成为科学计算、人工智能领域的最热语言,其数学工具包NumPy可谓居功至伟。但由于要兼顾建模能力和运算性能,NumPy相当抽象,写出来的代码非常精简高效,令人拍案叫绝。我常常感觉能读懂NumPy代码就非常烧脑了,自己要写,只能是望洋兴叹吧。计算相似度这几天做一些数据试验,需要计算一批向量两两之间的相似度,例如下面这个矩阵(以下称其为 U),从...
2019-11-11 15:43:02 610
原创 Redmine甘特图
Redmine能够自动根据项目任务(在Redmine中统一称为“Issue”)生成甘特图,比较方便实用。甘特图中任务条右侧缺省显示的是任务的“当前状态(status)”和“完成百分比(done_ratio)”,可以修改源代码来定制这里的显示内容,例如修改为“任务指派人(assigned_to)” 。首先找到甘特图的相关代码:<redmine_dir>/lib/redmine/h...
2016-07-08 12:02:42 6339
原创 MongoDB小技巧-用ObjectID查询某一时间范围内的数据
ObjectID是由精确到秒的时间戳再加上机器标识等信息组成的,并且建有索引,因此ObjectID本身就可以用于按时间范围查询数据,而不用专门另建时间戳字段和索引。下面用javascript代码片段说明如何使用ObjectID查询某一时间范围内的数据:function timeToObjId( time ) { var t = new Date(time); t =...
2015-10-27 14:51:11 12320 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人