自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Michael是个半路程序员

两个孩子的父亲,8年机械工程师,已转行互联网做算法,一起继续加油!高举智慧,她就使你高升;怀抱智慧,她就使你尊荣。-- 箴言(4:8)我的微信公众号:Michael阿明

  • 博客(2525)
  • 资源 (9)
  • 收藏
  • 关注

原创 《统计学习方法》学习笔记目录

此篇为 李航老师著的《统计学习方法》的学习笔记汇总,准备学习并敲一敲代码,还请大家不吝赐教!

2019-12-10 21:54:27 7496 108

原创 LeetCode解题汇总目录

此篇为学习完《数据结构与算法之美》后,在LeetCode刷题的汇总目录,方便大家查找(Ctrl+Find),一起刷题,一起PK交流!如果本文对你有帮助,可以给我点赞加油! Updated on 2022.6.12刷题可以按照不同的专题进行,便于加强某个知识点的理解。另有《剑指Offer》面试题(更新完毕)、《程序员面试金典》面试题(更新完毕)、LintCode代码能力测试CAT。LeetCode MySQL 数据库解题目录点击访问 我的 LeetCode 主页我的 GitHub 主页注:本文超过字数限制,

2019-09-06 13:43:51 75650 367

原创 吴恩达-《深度学习DeepLearning》汇总目录

从2019年2月底开始学习《数据结构与算法之美》,王争老师的课程非常好,到2019年8月底已经学完一遍,后面还要多次复习巩固以及OJ刷题。生命不息,学习不止,又要开始新的篇章了–《机器学习》,有点小兴奋,哈哈,之前Python已经大致过了2遍(小甲鱼的视频&从入门到实践),现在要补NumPy、复习高等数学、然后开始吴恩达老师的课程。此篇文章作为学习的汇总目录,供大家参考,一起学习,共同进步...

2019-08-28 00:43:33 7366 66

原创 《数据结构与算法之美》学习汇总

此篇文章是对自己学习这门课程的一个总结和课后的一些练习,做一个汇总,希望对大家有帮助。本人是半路程序员,2018年2月开始学习C++的,下面的代码基本都是C++11版本的,代码有错误的地方请不吝留言赐教。附有部分练习LeetCode、POJ的题目。

2019-04-22 21:13:00 23664 218

原创 用ChatGPT进行翻译、校对、扩写、聊天

生成客户服务电子邮件,邮件是根据每个客户的评论量身定制的。模型修改了语句,还删除了一些多余的空格。, 输出内容 比较稳定。

2023-05-21 10:03:21 58

原创 用ChatGPT总结和推断

在政府最近进行的一项调查中,公共部门员工被要求对他们的水平进行评分对他们工作的部门感到满意。结果显示,美国国家航空航天局是最受欢迎的部门的满意度为95%。美国国家航空航天局的一名员工John Smith对这一发现发表了评论,他表示:“美国国家航空航天局脱颖而出,我并不感到惊讶。这是一个与了不起的人一起工作的好地方难以置信的机会。我很自豪能成为这样一个创新的组织。这一结果也受到了美国国家航空航天局管理团队的欢迎,导演汤姆·约翰逊表示:“我们很高兴。

2023-05-14 07:05:37 93 1

原创 迭代prompt提示词

我们的产品采用五轮塑料涂层铝制底座和气压椅调整,方便升降操作。您可以选择软质地面或硬质地面轮轮,两种座椅泡沫密度可选:中等(1.8磅/立方英尺)或高(2.8磅/立方英尺),还可以选择无扶手或8个位置的PU扶手。我们提供多种选项,包括软质地面或硬质地面轮轮,两种座椅泡沫密度可选:中等(1.8磅/立方英尺)或高(2.8磅/立方英尺),无扶手或8个位置的PU扶手。此外,您还可以选择软质地面或硬质地面轮轮,两种座椅泡沫密度可选:中等(1.8磅/立方英尺)或高(2.8磅/立方英尺),无扶手或8个位置的PU扶手。

2023-05-08 23:46:08 52

原创 如何给ChatGPT写提示词

编写清晰、具体的指令可引导模型朝期望输出方向发展,不要混淆简短和清晰,更长的提示提供更多上下文信息,有助于更详细、相关的输出。这个回答好像是自己胡编乱造的吧。

2023-05-08 00:17:30 84

原创 少博士趣学Python - 绘制有趣图形

带着小孩(快8岁了)一起入门 python,参考书《少博士趣学Python》

2023-04-30 19:16:59 100 1

原创 ChatGLM-6B 安装试用

vim cli_demo.py 修改模型下载的路径。在生成答案的过程中,GPU显存使用在一直上涨。他没有回答鱼香肉丝相关的做法。其余文件从 huggingface 下载。解方程的答案是错的,模型不擅长数学问题。加载完模型后 GPU 使用情况。不懂前端,不好判断正确与否。试用以下代码,下载模型。模型记忆了上下文的 菜名。

2023-04-16 12:54:25 1241 1

原创 文心一言作图测试

可以看出文心一言优化了很多,文字理解能力变得更好了。

2023-03-23 09:45:40 311 1

原创 hive性能调优 读书笔记 - 问题排查、调优、数据处理模式

阶段,map 任务读取 AB两个表的数据,按连接条件发往相同的 reduce,在 reduce 中计算合并的结果。先读取小表A,构建其 hash 表,在读取B表,与之前的哈希表进行数据匹配。hive 2.3 以后可用,向量化执行,提高数据处理性能。以上两个 sql 的效果是等效的,执行计划一致。a 左连接 b,过滤条件是针对左表 a,完全。a 左连接 b,过滤条件是针对右表 b,b表。例如,求 sum,max, min。上面描述的是计算引擎的执行逻辑。了指定分区,a 表需要全表扫描。形式,只读取了表一次。

2023-03-11 22:50:55 340

原创 python多进程通信、共享变量

进程是计算机中正在运行的程序的实例。多进程指的是同时运行多个进程。

2023-03-09 13:33:59 429

原创 hive性能调优 读书笔记 - 调优多样性(改写sql、数据块大小、格式、分区、分桶)

再改写sql,将上面的 union 删掉,分别进行两次计算,看似少了 union, 会节省时间?(比上面的稍微快点,不同的环境比较的结果会有差异,跟书上的不一致)最后 hive 调优跟 hive 自身的迭代也有差异,需要注意。1个job,306s,比上面 390s 提升了 21.5%以下在一个job中完成 min,max 的查询。文件数量不一样,500个小文件 和 1个大文件。共有 10 个分区,每个分区下有16个文件。共2个job,397s,不比上面的写法快。单个大文件的执行耗时。5个job,390s。

2023-02-23 20:04:46 445 1

原创 python 按行数分割文件

行,分割成多个小文件,以下实现内存占用低。将一个大文件按照每个文件最多。test 文件有 5 行。

2023-01-14 20:57:57 976

原创 2022年算法工作总结

demo 打开了大家的思路,大家说想要看更多的时间段的数据,redis 存储不下了,消耗的内存非常大,咨询大数据的同事也说,这是不可行的,内存很贵的,推荐我使用 ES 存储,ES可以弹性伸缩,存储是放在磁盘里的,磁盘存储很便宜。今年学习(抄书)不多,陆续抄了些 pyqt、react、python高性能方面的、Rasa、Es 方面的知识,单就书而言,都没有完整系统的学完,也没有实践经验。这个包来手动分析,这个包可视化还挺好的,但是我面对的是很多种组合分析,手动点鼠标要累死我啊。-- 箴言(4:8)

2023-01-12 08:53:38 589

原创 pandas group by + rank 求在分组内的百分位、最接近某百分位的行

分组后,使用 rank。

2023-01-10 19:13:10 437

原创 ES mget、bulk、mappings

ES 不支持修改字段类型、没有隐式转换(比如 “123” 不会当成 数字 123)、建议指定 mapping。更新 query 条件下(value=99)的 doc,将其 value 改为 199。建立 index 的时候没有设置 mapping,根据你的 value 自动推断类型。检查 value = 100 的 doc 已被删除。写入多条,注意 create、index 的区别。or 同一index可简写。查看 mapping。

2022-12-30 21:36:13 447 2

原创 ES 安装、search、index、doc

看见 json,就算安装好了。配置文件会多出来一些配置。学习环境下,全部改为。

2022-12-27 18:56:30 630 1

原创 Rasa 基于知识库的问答 音乐百科机器人

learn from https://github.com/Chinese-NLP-book/rasa_chinese_book_code机器人返回了一个列表,用户说第X个,你得知道他说的是啥最简单的知识库 json 文件格式 实现中,每个 obj 都有至少有 属性意图想要进行知识库信息查询 将 映射为 将 的表述标注化为 知识库中 obj 的属性,在 nlu 训练数据中都要标注为 同时 domain.yml 文件需要加入2. 音乐机器人treenlu.ymlstorie

2022-12-23 09:54:59 863

原创 Rasa 基于规则的对话管理: 天气预报机器人

forms : weather_form : required_slots : # 表单必须指定该字段 - address - date - time。

2022-12-12 07:07:25 1031 2

原创 Rasa 使用ResponseSelector实现FAQ和闲聊

ResponseSelector 训练数据中的 意图命名格式ResponseSelector 需要采用格式(group称为 检索意图)普通意图 命名不能包含/字符示例nlu : - intent : faq/work_location examples : | - 校园招聘录取的应届生主要工作地点在哪里?ResponseSelector 定义 responses 作为 intent 问题答案约定:intent 名字假设为x/y, responses 名字为utter_x/y。

2022-11-30 23:58:53 944 4

原创 Rasa Core实践 报时机器人

满足后端交互计算需求,如查数据库、第三方api请求安装 rasa时,默认安装单独安装重写name()向服务器申明动作名字重写run()获取当前对话信息tracker 对象(对话状态追踪,获取历史实体、词槽等)domain 对象用户消息对象 dispatcher根据这些信息完成业务动作,如想改变对话状态,需要返回事件发送给 rasa服务器,没有的话,返回[]跟rasa一起安装的sdk,单独安装的。

2022-11-28 21:37:02 1120

原创 Rasa NLU 实践

这个文件里配置了:语种,分词器,模型、训练epochs等参数。这个文件里面有所有的意图的类别。这个配置文件里面有一些。该意图可能的说话例子。

2022-11-10 23:30:25 619 1

原创 docker-compose部署hive、kafka服务

放在 docker-hive路径下,cmd输入 docker-compose up -d,会部署hive相关的容器。然后需要在容器内部署写hive的服务,发现镜像的 Python 版本是3.4 的,需要升级。填写openssl的路径,还有取消5行注释,如上图所示。这一步的目的是,后面可以直接用自己的镜像,整了3天,做个记录,能帮到你少走弯路就好。更改 yml 配置,使用自己打包好的镜像。docker kafka 用的是。进行换源,加速后续下载,安装。把上面做好的镜像打包为。注意需要配置 ssl,

2022-10-23 00:15:25 1726 1

原创 Python 多进程处理数据

多进程也会相应消耗更多倍的资源,可以根据资源情况,设置进程数量来限制。就会等待子进程结束才会继续执行。,主进程直接会执行后续代码。

2022-10-16 16:22:40 1102

原创 Mysql timestamp字段自动更新 踩坑记录

可以解决问题(不希望 start_time、 finish_time 自动改变)字段的时候,我发现 start_time 字段自动变成了执行 sql 时的时间。上面的创建 Mysql table 的语句,在更新表的。经过探索发现,给字段加个默认值。

2022-10-14 19:43:00 527

原创 python 并发、并行处理、分布式处理

async def hello() : await asyncio . sleep(1) # 等待1 s print("hello michael") coro = hello() print(coro) # loop = asyncio . get_event_loop() loop . run_until_complete(coro) # hello michaelawait。

2022-08-30 09:29:40 705

原创 纯粹的python优化(数据结构、cache、推导、生成器)

对生成器对象进行迭代时,每次只返回一个计算结果,可以节省内存使用。如果是元组等,将按第一个元素排序,一样的话,按第二个,以此类推。PriorityQueue 优先队列,它是线程、进程安全的。两者可以替代显式的 for 循环,效率比 for 循环要高。插入和删除元素的时间复杂度都是 O(log n)字典树可以快速查找前缀字符串,课用于文字补全。在N篇文档中查找包含 X 单词的所有文档。,以后每次查询的时间复杂度是 O(1)当N非常大的时候这样的效率是很低的。标准库没有实现,有第三方包实现。...

2022-08-15 20:31:34 703

原创 python 基准测试(cProfile \ kcachegrind \ line_profiler \ memory_profiler)

该包可以了解代码是如何转换为字节码的, dis 表示 disassemble 反汇编。注意:细微的优化,速度有所提高,但可能并不显著,还需要保证算法正确。上面显示,测了58次,用时的最小、最大、均值、方差、中位数等。它是一个 py 包,安装后,对要监视的函数应用 装饰器。profile 对象开启和关闭之间可以包含任意代码。可以是用该工具了解指令的多少和代码是如何转换的。生成100个实例,模拟 0.1 秒。也需要对监视的函数 加装饰器。,看前几个就是耗时最多的几个。内存使用随时间的变化。......

2022-08-10 09:30:39 775

原创 pydev debugger: warning: trying to add breakpoint to file that does not exist: /tmp/xxx

pycharm在本地,连接远程进行debug,发现报错。,也填写了路径映射,都不行。

2022-08-02 11:52:27 1190

原创 LeetCode 1947. 最大兼容性评分和(状态枚举DP)

学生的答案用一个二维整数数组students表示,其中students[i]是一个整数数组,包含第i名学生对调查问卷给出的答案(下标从0开始)。例如,学生答案为[1,0,1]而导师答案为[0,0,1],那么他们的兼容性评分为2,因为只有第二个和第三个答案相同。有一份由n个问题组成的调查问卷,每个问题的答案要么是0(no,否),要么是1(yes,是)。著作权归领扣网络所有。配对的学生与导师之间的兼容性评分等于学生和导师答案相同的次数。请你找出最优的学生与导师的。...

2022-07-30 14:53:28 473

原创 LeetCode 2343. 裁剪数字后查询第 K 小的数字

请你返回一个长度与queries相等的数组answer,其中answer[i]是第i次查询的结果。裁剪到剩下x个数位的意思是不断删除最左边的数位,直到剩下x个数位。长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!商业转载请联系官方授权,非商业转载请注明出处。给你一个下标从0开始的字符串数组nums,其中每个字符串。再给你一个下标从0开始的二维整数数组queries,其中。nums中的字符串可能会有前导0。来源力扣(LeetCode)...

2022-07-30 13:29:27 421

原创 LeetCode 2349. 设计数字容器系统(SortedSet)

长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。来源力扣(LeetCode)返回系统中给定数字的。

2022-07-30 12:50:27 448

原创 LeetCode 2333. 最小差值平方和(贪心)

同时给你两个正整数k1和k2。你可以将nums1中的任意元素+1或者-1至多k1次。数组nums1和nums2的差值平方和定义为所有满足0

2022-07-30 12:28:21 727

原创 LeetCode 2336. 无限集中的最小数字(SortedSet)

长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!现有一个包含所有正整数的集合[1,2,3,4,5,…著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。来源力扣(LeetCode)...

2022-07-30 11:21:42 300

原创 LeetCode 2353. 设计食物评分系统(sortedcontainers)

注意,字符串x的字典序比字符串y更小的前提是x在字典中出现的位置在y之前,也就是说,要么x是y的前缀,或者在满足x[i]!=y[i]的第一个位置i处,x[i]在字母表中出现的位置在y[i]之前。食物由foods、cuisines和ratings描述,长度均为n。长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!修改名字为food的食物的评分。是第i种食物的烹饪方式。是第i种食物的最初评分。是第i种食物的名字。...

2022-07-30 11:06:35 343

原创 LeetCode 2352. 相等行列对

给你一个下标从0开始、大小为nxn的整数矩阵grid,返回满足Ri行和Cj列相等的行列对(Ri,Cj)的数目。如果行和列以相同的顺序包含相同的元素(即相等的数组),则认为二者是相等的。长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。来源力扣(LeetCode)...

2022-07-29 23:57:31 1487

原创 LeetCode 2348. 全 0 子数组的数目

长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。子数组是一个数组中一段连续非空元素组成的序列。给你一个整数数组nums,返回。来源力扣(LeetCode)...

2022-07-29 23:29:01 230

原创 LeetCode 2342. 数位和相等数对的最大和

长按或扫码关注我的公众号(Michael阿明),一起加油、一起学习进步!著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。给你一个下标从0开始的数组nums,数组中的元素都是。请你找出所有满足条件的下标i和j,找出并返回。请你选出两个下标i和j。来源力扣(LeetCode)...

2022-07-29 23:17:58 1316 1

tensorflow_datasets.tf_flowers.3.0.1.rar

tensorflow tf_flowers数据集, win路径C:\Users\yourname\tensorflow_datasets\tf_flowers\3.0.1\*, linux路径:/root/tensorflow_datasets/tf_flowers/3.0.1/*

2021-01-26

Python-3.7.9.tar.xz

源码安装包, linux可用

2021-01-24

distilbert-base-uncased-finetuned-sst-2-english 预训练模型

来自 https://huggingface.co/distilbert-base-uncased-finetuned-sst-2-english/tree/main#

2021-01-12

bert-base-uncased 预训练模型

来自 https://huggingface.co/bert-base-uncased/tree/main

2021-01-12

python383.chm

python3.8.3参考文档

2020-06-05

WinRAR5.60.zip

解压缩软件,无广告。

2020-06-05

Everything-1.4.1.969.x64.zip

非常快速的查找工具,比windows的自带搜索快速很多倍,提高工作效率的小工具,非常好用!非常快速的查找工具,比windows的自带搜索快速很多倍,提高工作效率的小工具,非常好用!

2020-03-27

ScreenToGif.2.22.1.Portable.zip

桌面录屏成动图的小软件。生成的图片尺寸小,质量高,非常好用!桌面录屏成动图的小软件。生成的图片尺寸小,质量高,非常好用!

2020-03-27

【Excel示例文件】深度学习的数学.rar

深度学习的数学,随书示例文件,辅助更好的理解深度学习的原理!

2020-03-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除