综合
文章平均质量分 75
juhanishen
少时留学芬兰21载,中年孝敬父母,叶落归根。曾就职于诺基亚,富士通,西班牙电信,CapGemini,埃森哲等世界500强公司。
展开
-
LLM (Large language model)的指标参数
本文详细介绍了LLM指标中Rouge和BLEU指标。Rouge是用来文本摘要和概括的,BLEU是给翻译场景中用的指标原创 2024-02-23 15:48:22 · 1600 阅读 · 0 评论 -
剖析GPT,背后的算法,文献,行业影响和中小企业落地建议
GPT 剖析,背后的算法,文献,行业冲击,中小企业怎样落地。原创 2023-03-25 15:39:42 · 5128 阅读 · 0 评论 -
日志的应用,由浅入深,经验分享(二)
日志高级应用的某些细节。比如在线针对性热修改,日志在线,离线模式,技术选型原创 2023-01-24 14:04:16 · 186 阅读 · 0 评论 -
日志的应用,由浅入深,经验分享(一)
架构师所面临的日志问题,加以分类阐述。以及日志应用要注意的问题。原创 2023-01-19 15:46:28 · 734 阅读 · 0 评论 -
核酸检测系统的潜在性能问题猜想
核酸检测系统性能问题思考,笔者给出影响性能的4个潜在因素。原创 2022-09-04 10:47:48 · 442 阅读 · 0 评论 -
Linux 常用命令
这张图是我从linkedin的一则消息中截屏下来的,觉得挺实用的,分享给大家。运维,开发都可以用。这个是很基本的Linux命令,netstat,top 都没有列出来。日后,再补点常用的Linux命令,先做为第一版。沈建军于2022年5月29日周日8:40分上海松江。CSDN...转载 2022-05-29 08:42:58 · 121 阅读 · 0 评论 -
计算机网上自学,线上教学无需缴纳昂贵学费,留学生活费
我一直是学计算机软件的,本科的毕业论文是纯软件,硕士的毕业论文也是纯软件。工作后,有的计算机知识都老化了,需要学新的技术,发现网上学都可以了。现在,留学很盛行,但留学在国外住宿,生活费,学费,都是不小的开支。只有有自学能力,我至少发现计算机偏软件行业的完全不用去留学,只要有VPN,英语阅读和书写能力,计算机知识完全可以通过网上自学取得。本人的机器学习,人工智能,3D,区块链知识都是从网上取得的,配合一些线上,线下的技术论坛,比如云原生meetup,亚马逊的技术论坛,。。。完完全全可以把计算机玩转,只要自己有原创 2022-05-09 14:01:39 · 1128 阅读 · 0 评论 -
2022年新冠疫情后上海的电子商务,数字化经济可能的新趋势
电子商务,数字经济在2022年上海疫情后的预测原创 2022-04-28 14:41:02 · 475 阅读 · 0 评论 -
斐波那契数列(Fibonacci sequence)解决方法,面试60分和90分的区别
Fibonacci的解决方案,60分的方案和95分的方案对比,100分的可以作为回家作业,提示用python写。原创 2022-03-27 15:22:44 · 2178 阅读 · 4 评论 -
3D 重构的一些应用场景
3D 重构是利用2D 照片合成3D 图像。3D重构也是人工智能领域的一个分支。因为业界有很多应用,所以记下来,供大家参考。第一次遇到3D重构的课题是老东家在物流领域的业务场景。后来发现,3D重构的应用场景还真不少。3D重构一个重要指标是精准度,又跟摄像头的品质有关。今天讲的不是具体算法,而是罗列业务应用领域,让大家可以发挥想象,运用到其他类似的业务场景中去。也可以给我留言,我可以添加到这个博客中去,供大家一起参考。1. 医疗领域上海中山医院开肝肿瘤的时候,有时就会先进行3D成像,然后精准动刀。原创 2022-03-24 21:44:10 · 2040 阅读 · 0 评论 -
EDA(Explore Data Analysis)一步一步详解
EDAEDA 是 Explore Data Analysis 的缩写,是机器学习处理数据的第一步。它影响建模的质量或准确性。下面的这篇来之Analytics Vidhya的博客写得浅显易懂。所以,尽可能翻译或做笔记。A Comprehensive Guide to Data Exploration总览有关数据探索(EDA)的完整教程 我们涵盖了数据探索的几个方面,包括缺失值估算,异常值去除和特征工程的技巧。介绍没有数据探索分析的捷径。 If you are in a state of翻译 2022-02-15 15:38:49 · 9412 阅读 · 3 评论 -
Person 系数
Pearson 系数:本文来自于此CSDN链接 皮尔森(pearson)相关系数: 在这三大相关系数中,spearman和kendall属于等级相关系数亦称为“秩相关系数”,是反映等级相关程度的统计分析指标。今天暂时用不到,所以现在只做pearson的相关研究。 公式定义为:两个连续变量(X,Y)的pearson相关性系数(Px,y)等于它们之间的协方差cov(X,Y)除以它们各自标准差的乘积(σX,σY)。系数的取值总是在-1.0到1.0之间,接近0的变量被成为无相关性,接近..转载 2022-02-15 15:33:13 · 2472 阅读 · 0 评论 -
机器学习全生命周期,一步一步,中长篇(三)总共三篇
We’ll follow the general machine learning workflow step-by-step 第三部分:Data cleaning and formatting Exploratory data analysis Feature engineering and selection Hide and filter Sensitive Feature Compare several machine learning models on a performance m翻译 2022-02-08 11:36:07 · 274 阅读 · 0 评论 -
机器学习全生命周期,一步一步,中长篇(二)总共三篇
本文是英文原著翻译,并结合了其他文献的一个有益集成。中文在英文简述的后面。We’ll follow the general machine learning workflow step-by-step 第二部分:Data cleaning and formatting Exploratory data analysis Feature engineering and selection Hide and filter Sensitive Feature Compare several mac翻译 2022-02-08 11:04:35 · 321 阅读 · 0 评论 -
机器学习全生命周期,一步一步,中长篇(一)总共三篇
本文是英文原著翻译,并结合了其他文献的一个有益集成。中文在英文简述的后面。We’ll follow the general machine learning workflow step-by-step:Data cleaning and formatting Exploratory data analysis Feature engineering and selection Hide and filter Sensitive Feature Compare several machine翻译 2022-02-08 10:42:25 · 575 阅读 · 0 评论 -
CQRS and Event Sourcing in Java
1. IntroductionIn this tutorial, we'll explore the basic concepts of Command Query Responsibility Segregation (CQRS) and Event Sourcing design patterns.While often cited as complementary patterns, we'll try to understand them separately and finally see转载 2021-08-16 15:49:50 · 255 阅读 · 0 评论 -
Domain-driven design essentials - Key Concepts (continued)
Domain-driven design essentials - Key Concepts (continued)PostedSep 5, 2020byIvan PenchevChapter 2The Domain Model - ContinuedFig. 05 DDD diagram for other Domain objectsWe are continuing our journey in the Domain model.AggregatesAs we ...转载 2021-08-06 15:04:57 · 195 阅读 · 0 评论 -
Domain-driven design essentials - Key Concepts
本篇是DDD的基础,从这个链接转载。DDD的方法非常好,就是根据业务场景解耦,形成相对对立封装的组建,用抽象的封装(interface)包容组建替换,代码和部署独立,使得代码可维护,可测试,容易不同形式的部署。DDD显然是软件开发的高境界。所以笔者转载一篇好文。Domain-driven design essentials - Key ConceptsPostedAug 26, 2020byIvan PenchevChapter 1IntroductionIn the las...转载 2021-08-06 14:17:04 · 226 阅读 · 0 评论 -
ARIMA 算法解析,一个通俗的解释
ARIMA算法是时序算法的经典算法。网上有很多博客,笔者认为都比较数学化,不是那么让初学者一读就能懂得,换句话说,不是很通俗。本篇博客是基于英文博客来组织的,不是直接翻译,但代码,原始数据都来自这篇英文博客,所以说是翻译而来的。1. 背景ARIMA 算法的本质就是把数据中带有趋势的(trend)的,带有季节性的(seasonal)的, 带有业务场景周期性(domain cycle)的规律先找出来,一层一层将有规律的信息从数据中抽出来,最后的数据就剩下没有规律的,或叫噪声,理想的时候是白噪声。本文的.翻译 2021-05-27 15:01:17 · 19406 阅读 · 7 评论 -
机器学习全生命周期
本系列博客是结合coursera的加州大学洛杉矶分校的机器学习的课程和Medium的系列文章整合而成。本系列是给机器学习的初级学者编写的机器学习全周期的步骤。机器学习分五个部分:本篇博客是系列的第一篇。1. 获得数据: 这个阶段的目标是辨别和获得所有和业务场景/命题有关的数据,就是收集到所有需要的,有关的数据。 在这个阶段中,1)我们要辨别数据源 2)采集数据 3)集成数据。2. 预备数据: 这个阶段有两步。第一步是 探索数据,第二步是 预处理数据 ...原创 2021-05-13 13:35:17 · 1069 阅读 · 0 评论 -
Ray 学习笔记,Linux 安装 htop
Ray 是 UC berkley 提出的分布式机器学习。sklearn 是运行在单机上的机器学习,虽然支持多线程,但分布式并不支持。Ray 也支持 tensorflow,pytorch 和其他机器学习包。要分布式学习,当然少不了讲几核的cpu,负载是否能均匀分布,那就要用命令观察cpu核的负载分布情况。笔者先前用top命令,但top命令不是交互式的,用起来不方便。有了htop,就喜欢上htop了,因为htop可以交互式的排序,搜素,过滤等等。但使用htop前,需要安装一下。本博文就是简单介绍一下安装htop原创 2021-04-16 16:05:35 · 296 阅读 · 0 评论 -
Ray 学习笔记: 安装 anyscale-academy的最新 ray 学习资料常遇到的问题
学习Ray,新手,比如我,都会从tutorial入手,有简单的开始上手,然后进一步挖掘,学习更深的知识要点。本文,是介绍笔者在安装 ray 的最新tutorial,所遇到的问题,以及如何解决的。供后来人少走弯路。1. Ray 最新的学习资料在这个链接。这个链接有一步,一步的介绍,笔者暂时不会翻译这个tutorial,但会后续中写下心得体会。2. 安装ray,最好安装 anaconda,因为这个环境管理软件会使后续的开发很容易,因为它通过conda命令直接设置所有开发软件所需的依赖包及其版本,是一站式原创 2021-03-23 15:19:46 · 676 阅读 · 0 评论 -
Ray 学习笔记,日志
本系列是作者用 python 学习 Ray 框架的笔记。 Ray 是 UC berkley 提出的分布式机器学习。sklearn 是运行在单机上的机器学习,虽然支持多线程,但分布式并不支持。如果读者不熟悉Ray,本篇文章不适合新手上路,可以学习文章后尾的两篇文献。刚上手学习Ray,自然要想着怎样加埋点,怎样写日志。写埋点,既可以用print命令,也可以用loggin模块。一般而言,对于ray都工作,但当线程中断,睡眠后,再唤醒,print和logging就不工作。目前的ray版本是1.0.1post。后原创 2021-03-12 16:07:35 · 1260 阅读 · 0 评论 -
Mongo Pub/Sub
Mongo是很有特色的基于文档(Document)的NoSQL,这是一个通用性的数据库。也就是说它支持很多功能,很多业务场景。有的小公司如果单种业务少,但功能需要多,那么后台用Mongo再好不过,因为只需要一个后台,数据库管理和开发,数据分析,报表,未来维护都节约成本。这只是Mongo被业界广泛应用的原因之一。 这篇博客介绍Mongo的队列消息的功能,正好应用了Mongo自身的不可更改的保证时间先后翻译 2017-07-17 13:36:14 · 1067 阅读 · 0 评论 -
沈工工作室开张了
先写一下课题,欢迎来函告诉我,哪些课题你愿意我先写,先介绍。 -用MongoDB的capped collection做队列服务。 -什么是Restful -spark和Mongo的简单实践 -VoltDB介绍 -NoSQL介绍 -Vault介绍 -Terraform介绍 -vagrant介绍 -具有时间序列的应用多种解法 -WebGL介绍 -人工智能算法和链接 -日志应用简介原创 2017-07-17 14:46:16 · 399 阅读 · 0 评论 -
Decorator的又一应用(1)
Design Pattern的又一个应用。时候,我们编写程序时,会遇到代码的流程是有规律的,但其中一个环节有微小的差异,以致要写很多函数。本文的修饰者应用减少代码量,便于维护。原创 2017-07-17 14:26:03 · 257 阅读 · 0 评论