【2024W23】肖恩技术周刊(第 1 期)

周刊内容:主要是记录一些业界资讯或技术内容,没有明确分类全凭个人喜好。
历史周刊:shawn-weekly
订阅方式:

备注:内容收集基于developer-hotspots-summary,文章摘要生成基于kimi,最后经人工删减校验后发布。

本期发布时间:2024-06-07

业界资讯

马斯克旗下的人工智能初创公司xAI在5月26日宣布完成60亿美元的B轮融资,使得公司估值达到近180亿美元,成为全球AI独角兽企业之一。xAI成立于2023年4月,团队成员主要来自谷歌DeepMind和微软等顶尖AI公司,专注于构建通用AI模型。2023年11月,xAI发布了首个AI大模型产品——聊天机器人Grok,旨在通过社交平台X实时了解现实世界,并能回答敏感问题。2024年3月,xAI推出了包含3140亿参数的Grok-1,随后推出能处理长文本和高级推理的Grok-1.5。4月,xAI发布了多模态大模型Grok-1.5V,其在理解现实世界方面优于其他AI模型。xAI的快速发展和融资能力显示了其在AI领域的潜力和马斯克在该领域的雄心。

QS Quacquarelli Symonds于2025年发布了世界大学排名,麻省理工学院连续13年位居榜首,帝国理工学院升至第二。牛津、哈佛和剑桥分别位列三至五位。北京大学和清华大学进入前20,北京大学升至第14位,清华大学排名第20。中国内地大学表现突出,近70%排名上升,五所大学进入前50,研究影响力显著。中国内地高校在师均论文引用得分上亚洲领先。

斯坦福大学AI团队发布的Llama3-V模型被指控抄袭中国面壁智能公司的MiniCPM-Llama3-V 2.5模型。Llama3-V声称以500美元低成本训练出高性能多模态大模型,但很快被细心网友发现其模型结构、代码与面壁智能的成果高度相似。网友在面壁智能的GitHub项目下留言提醒,并提供了证据。面对质疑,斯坦福团队删除了相关项目和GitHub仓库,但最初试图解释称只是使用了面壁智能的tokenizer。面壁智能CEO李大海要求Llama3-V给出正式解释。网友进一步发现,Llama3-V在未公开的实验性特征上与MiniCPM-Llama3-V 2.5表现出高度相似性,包括错误分布和特定功能如识别清华简。这起抄袭事件在AI圈内引起广泛关注,斯坦福团队的行为受到质疑。

2024年6月3日,美国纽约证券交易所(NYSE)因软件Bug导致市场混乱。当日上午,约40只股票交易被紧急暂停,包括伯克希尔哈撒韦A类股票,其价格暴跌至185.10美元,较前一交易日收盘价62.74万美元下跌近100%。巴里克黄金和NuScale Power股票同样出现约99%的暴跌。技术问题源于纽交所子公司Consolidated Tape Association(CTA)更新证券信息处理器(SIP)软件时出现故障。CTA负责交易数据传播,SIP处理和整合数据。问题在约两小时后得到解决,交易恢复正常。纽交所宣布取消包括伯克希尔A类股在内的错误交易。

技术专家分析,问题可能出在数据库上,软件更新可能带来兼容性问题、配置不匹配、软件缺陷或依赖性问题。开源数据库联合创始人Jason认为,纽交所CTA系统可能在数据一致性上出现问题,尤其是在新旧系统切换时。他强调金融核心系统中数据的正确性和一致性至关重要,企业IT部门需要进行新旧系统切换演练和一致性测试。

为避免类似问题,专家建议在数据库版本变更前进行兼容性测试、制定灾难恢复计划、逐步切换、加强监控和日志记录,并进行人员培训。同时,IT部门应进行系统定期备份、变更管理、自动化测试、故障演练和第三方审计,以减少系统故障风险,确保业务连续性和稳定性。

Meta首席科学家Yann LeCun在巴黎VivaTech大会上建议学生不要从事大型语言模型(LLM)的工作,认为这是大公司的事情,学生无法贡献。腾讯的《地下城与勇士:起源》手游首周营收达10亿元人民币,下载超260万次。米哈游再次起诉哔哩哔哩侵权。GPT-4o向所有人免费开放,功能包括联网搜索、数据分析等。字节跳动收购耳机制造商Oladance,探索AI硬件。中国首例消费者起诉苹果垄断案一审宣判,法院驳回原告诉求。刘强东对京东内部考勤问题表示不满,提出"业绩不好不是我的兄弟"。OpenAI组建新的安全团队,前安全研究员Jan Leike转投Anthropic。昆仑万维的天工AI日活用户超100万。知乎PC网页端非登录用户无法查看回答全文。联想集团裁员7500人,遣散费5500万美元。软银计划每年向AI领域投资近90亿美元。谷歌搜索黑幕被揭露,包括用户数据被挪用等问题。Meta为CrowdTangle增添安全功能以消除欧盟顾虑。苹果据悉已与OpenAI达成协议,将ChatGPT引入iOS 18。XZ 5.6.2版本发布,移除后门代码。

技术博客

文章是关于Java Development Kit (JDK) 17的新特性的介绍和讨论。作者首先提到JDK版本更新迅速,但JDK8仍然是最广泛应用的版本。尽管作者本人不太倾向于升级JDK,但JDK17的一些新特性让他改变了看法。以下是文章中提到的JDK17的主要新特性:

  1. 文本块:允许更简洁地编写长文本,如JSON、HTML、SQL等,提高了代码的可读性。
  2. NullPointerException增强:提供了更详细的空指针异常信息,帮助开发者快速定位问题。
  3. Records:简化了POJO类的编写,通过简洁的语法定义数据类,提升了代码的整洁度和可维护性。
  4. 全新的switch表达式:switch表达式支持返回值,并且可以与模式匹配结合使用,提高了代码的简洁性和效率。
  5. 私有接口方法:允许在接口中添加私有方法,方便了代码的组织和复用。
  6. 模式匹配:增强了instanceof表达式,使类型检查和类型转换更加简洁和高效。
  7. 集合类的工厂方法:简化了集合的创建,如使用Set.of直接创建集合。
    文章还提到了其他一些新特性,包括:
  • 新的String方法,如repeatisBlankstriplinesindenttransform
  • Stream API的增强,增加了takeWhiledropWhileofNullableiteratetoList等方法。
  • 全新的HttpClient,提供了更现代和方便的HTTP客户端API。
  • jshell工具,支持在命令行下执行Java程序,类似于Python的交互式REPL。
  • 通过java命令直接执行Java文件,简化了编译和运行流程。
  • ZGC(Z Garbage Collector),一个可伸缩的低延迟垃圾回收器。

最后,作者强调了作为程序员持续学习和适应新技术的重要性,并指出随着Java 8即将停止免费官方支持,越来越多的项目将转向使用Java 17,包括Spring Boot 3.0,它是基于Java 17构建的。

这篇文章主要介绍了精准测试模型的原理及其在多维表格工程中的应用。文章首先阐述了在快速发展的公司中,前端项目数量庞大,需求迭代速度快,系统架构复杂,测试周期短,导致人效问题突出。为了解决这些问题,提出了精准测试的概念,它通过深入系统代码层级,有针对性地聚焦测试范围,提高测试过程的可追溯性和透明度,以提升测试效率和质量。

文章详细解释了精准测试的基本概念,包括它与传统黑盒和白盒测试的区别,以及如何通过获取测试用例和代码逻辑之间的关联信息来实现精准测试。此外,文章还介绍了几种相关技术,如代码覆盖率、代码插桩技术、测试用例智能推荐和智能缺陷定位。

在飞书多维表格业务的应用案例中,文章描述了如何通过精准测试减少回归测试的人力和时间成本,提高测试效率。具体措施包括建立前端覆盖率机制、录制推荐工程和业务扩展工程。通过这些措施,实现了测试用例的智能推荐和缺陷的精准定位,显著提升了测试的质量和效率。

文章还讨论了业务创新,包括如何通过精简工程进一步提升用例收益和降低成本。通过数学和算法的方法,论证了精简用例集合的有效性,并给出了具体的评判规则。

最后,文章总结了精准测试在飞书多维表格业务中的收益,包括线上问题召回率的提升、推荐冗余的降低、测试人效的提升,并对未来的推进方向进行了展望。

这篇文章记录了作者在排查一个应用容器JVM内存使用率异常升高的问题。起初,问题出现在应用jimkv开启异步日志打印后,JVM内存持续上涨。作者首先排除了日志打印量过大和大日志问题,随后通过分析堆内存dump文件,发现大量char[]数组占用了内存。进一步调查发现,这是由于log4j异步日志在处理超过一定长度的日志时,会截断并创建新的字符数组,这些数组在多次YGC后存活进入Old区,导致内存上涨。

为了解决这个问题,作者采取了以下措施:关闭log4j的threadlocals特性以避免Garbage-free特性引起的内存问题,调整log4j.maxReusableMsgSize的值来减少字符数组的截断和扩容,以及控制日志输出长度,避免打印过长的日志内容。最终,通过这些措施成功解决了内存上涨的问题,同时保留了异步日志的Garbage-free特性,提升了应用性能。

文章最后提出了一个关于RingBufferLogEvent中messageText字段占用内存空间的疑问,并鼓励读者参与讨论。作者还分享了排查过程中的参考资料,为读者提供了进一步学习log4j异步日志的途径。

开源项目

ChatTTS 是一个为对话场景设计的文本到语音合成模型,支持英语和中文。它经过超过10万小时的中英文数据训练,开源版本在 HuggingFace 上提供。模型特点包括对话式语音合成、精细的韵律控制和优于大多数开源模型的韵律表现。使用时需注意,该技术应负责任和道德地使用,以避免潜在的滥用。开发团队计划开源更多资源,并提供了基础和高级使用示例。

Syncthing 是一个开源的文件同步工具,旨在在多台设备间安全、自动地同步文件。它强调数据安全和用户隐私,易于使用且跨平台。用户可以通过 Docker 部署,或在不同操作系统上使用 GUI 客户端。项目提供详尽的文档和入门指南,支持通过论坛和邮件报告问题和安全漏洞。自 v0.10.15 起,发布版本通过 GPG 签名确保真实性,源代码遵循 MPLv2 许可证。

Xiaoju Survey 是滴滴出行开发的开源问卷系统,提供轻量级、安全、多功能的在线调研解决方案。支持40+种题型和100+精选模板,适用于市场调研、客户满意度调研等场景。技术栈包括Vue3、ElementPlus、Nestjs和MongoDB。项目优势在于全面性、专业性、轻量化设计和低二次开发成本。提供快速启动指南和社区交流支持。

工具分享

这篇文章是关于推荐一些超级棒的谷歌浏览器插件,旨在提升用户的上网体验和工作效率,特别是对前端开发者来说非常有益。文章中推荐了以下几款插件:

  1. FeHelper(前端助手):提供多种前端开发工具,如JSON格式化、二维码生成、编码转换等,以提高开发效率。
  2. 沉浸式翻译:提供在线翻译功能,帮助用户快速翻译网页上的单词、句子或段落,包括双语对照翻译、输入框翻译等。
  3. SessionBox:允许用户在同一浏览器上同时登录同一网站的多个账户,支持私密会话。
  4. Axure RP Extension for Chrome:帮助用户在Chrome浏览器中预览Axure RP制作的原型设计,无需离开浏览器即可查看和测试原型。
  5. Infinity 新标签页:允许用户定制和美化浏览器的新标签页,添加自定义背景、时钟、天气预报等。
  6. GoFullPage:用于捕捉整个网页并保存为图片或PDF文件,包括未显示在屏幕上的部分。
  7. Tampermonkey 篡改猴(油猴脚本):允许用户安装和运行自定义的JavaScript脚本,以定制和增强网页内容及功能。
  8. Chrome清理大师:提供一键清理浏览器垃圾的功能,如缓存、历史记录、Cookie等,以提升浏览器性能。
  9. User-Agent Switcher for Chrome:帮助用户模拟不同设备的User-Agent,以便测试网站在不同设备上的显示效果。
  10. Window Resizer:帮助开发人员和设计师调整浏览器窗口大小,模拟不同设备上的屏幕尺寸,测试响应式设计。
  11. Page load time:测量网页加载时间,包括DNS解析时间、连接时间等,并提供性能分析功能。

这篇文章是一份详细的教程,介绍了如何将Coze AI机器人与微信群进行对接,以实现自动回复群内信息的功能。Coze是一个AI智能体创作平台,支持与微信公众号、服务号和客服等进行对接。作者首先介绍了微信的不同功能和Coze平台的相关配置,包括创建API令牌和记录Bot ID。接着,详细阐述了服务器配置的步骤,包括使用宝塔面板和Docker部署服务,并提供了容器编排模板。最后,作者还解答了一些常见问题,如API令牌的作用、轻量应用服务器的选择等,并强调了即使不懂编程,按照教程也能成功配置AI机器人。

其他周刊

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值