自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 langchain的Retrievers调查报告

请注意,"是否是第三方API"列是根据服务是否由原开发团队以外提供来判断的。例如,Weaviate和Chroma等可能是由其开发团队直接提供的,而Vectara和Tencent Cloud VectorDB等服务可能是第三方API。具体情况可能根据服务的实际提供情况有所不同。请注意,开发团队列是根据每个技术通常被归属的组织或项目进行填写的。有些项目可能是由特定的公司或组织开发的,而其他一些可能是由开源社区或多个贡献者共同开发的。此外,某些服务可能由不同的团队或公司提供,具体取决于服务的性质和提供方式。

2024-06-26 10:09:27 446

原创 Java 排查,评测/刨析,监测,管理的工具の简介

每一种计算机开发语言为了辅助开发都会给出一系列的工具来辅助开发。python开发的时候上层会有line_profiler分析语句级别的工具,然后底层会有memory_profiler分析内存,cpu,进程,线程的工具。这些算是动态分析工具,还有静态分析工具Pylint。简单介绍一些java的排查,评测/刨析,监测,管理的工具jcmd jdk1.7之后新加的工具。该工具需要向jvm发送诊断命令,所以必须和jvm在同一台机器上使用。并且需要拥有和jvm同等权限。 需要远程调用jcmd的时...

2021-10-14 11:57:40 115

原创 JRE 和 JDK

JRE 和 JDK 的区别是什么?JDK主要包含三部分,第一部分就是Java运行时环境,JVM。第二部分就是Java的基础类库,这个类库的数量还是非常可观的。第三部分就是Java的开发工具,它们都是辅助你更好的使用Java的利器。JRE顾名思义是java运行时环境,包含了java虚拟机,java基础类库。是使用java语言编写的程序运行所需要的软件环境,是提供给想运行java程序的用户使用的。如果安装了JDK,会发同你的电脑有两套JRE。一套位于\Java\jdk1.8 \jre一.

2021-10-14 11:16:16 82

原创 系统架构演进,待续

系统架构演进单一应用架构当网站流量很小时,只需一个应用,将所有功能都部署在一起,以减少部署节点和成本。此时,用于简化增删改查工作量的 数据访问框架(ORM) 是关键。垂直应用架构当访问量逐渐增大,单一应用增加机器带来的加速度越来越小,将应用拆成互不相干的几个应用,以提升效率。此时,用于加速前端页面开发的 Web框架(MVC) 是关键。分布式服务架构当垂直应用越来越多,应用之间交互不可避免,将核心业务抽取出来,作为独立的服务,逐渐形成稳定的服务中心,使前端应用能更快速的响应多变的市...

2021-02-09 16:43:22 122

原创 scrapy+selenium+chrome:问题笔记,持续更新。。。

20210207:问题:个别文件不请自来,竟然自动下载到了我的工程代码路径下。如何特定问题原因:开始有些盲目,以为可以直接百度谷歌到真正的原因。还是太天真。寻找问题原因,还是要debug。先浏览一边代码在自己认为可能出问题的加上断点,然后debug。driver.get(request.url)这句执行之后,文件就下载了。此时我还在考虑代码的问题。其实这个时候应该把问题转到浏览器上了。把url拷贝到浏览器上,果然开始自动下载了。开始想如何禁止浏览器的自动下载。其实这个思路不对的。

2021-02-07 15:27:27 307

原创 备忘--常用命令(一)

linux:命令行打开当前目录文件夹或文件nautilus .// 空格 + 点watch命令文件查找。其中查找的命令主要有find和grep。区别:(1)find命令是根据文件的属性进行查找,如文件名,文件大小,所有者,所属组,是否为空,访问时间,修改时间等。 (2)grep是根据文件的内容进行查找,会对文件的每一行按照给定的模式(patter)进行匹配查找。windows:命令行打开当前目录文件夹或文件start . // 空格 + 点...

2021-01-16 22:50:52 182 1

原创 linux-shell常见问题。。待续。。

字符串处理总结截取#* 和 ##*#删除从左到右,第一个匹配字符串为止。相当于left##删除从左到右,最后一个匹配字符串为止%*和%%*%删除从右到左,第一个匹配字符串为止。相当于right%%删除从右到左,最后一个匹配字符串为止。${:}或者${::}${str:start}${str:start:len} 正数从左开始,负数从右开始${str//,/ } 意思是讲,替换成空格缺点是如果分隔的字符串含有空格,这个分割就会错误。下面的方法,可解决上面的问..

2021-01-16 22:49:23 111

原创 python培训 第十三课,正则。

正则文本操作的瑞士军刀。1.只适合匹配文本字面,不适合匹配文本意义:像匹配url,email这种纯文本的字符就很好,但比如匹配多少范围到多少范围的数字,如果你这个范围很复杂的话用正则就很麻烦。或者匹配html,这个是很多人经常遇到的,写一个复杂匹配html的正则很麻烦,不如使用针对特定意义的处理器来处理(比如写语法分析器,dom分析器等)2.容易引起性能问题:像.*这种贪婪匹配符号很容易造...

2019-10-06 00:05:16 106

原创 python培训 第十二课,多线程,多进程。

python多线程创建线程python中有两种方式实现线程:实例化一个threading.Thread的对象,并传入一个初始化函数对象(initial function )作为线程执行的入口; 继承threading.Thread,并重写run函数;python多进程创建进程创建进程的方式和创建线程的方式类似:实例化一个multiprocessing.Process的对...

2019-10-05 23:54:04 128

原创 python培训 第十一课,网络编程。

网络基础知识,socket编程,tcp,udp等,参照https://www.cnblogs.com/dalaoban/p/9331113.html读取网页HTML代码,并保存旧版Python中urllib模块内有一个urlopen方法可打开网页,但新版python中没有了,新版的urllib模块里面只有4个子模块(error,request,response,par...

2019-10-05 23:47:01 196

原创 python培训 第十课,linux命令。

操作时备查。系统信息arch 显示机器的处理器架构uname -m 显示机器的处理器架构uname -r 显示正在使用的内核版本dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI)hdparm -i /dev/hda 罗列一个磁盘的架构特性hdparm -tT /dev/sda 在磁盘上执行测试性读取操作cat /proc/cpui...

2019-10-05 23:22:19 112

原创 python培训 第九课,python语法进阶。深拷贝,浅拷贝,property属性,with语句,上下文管理器,闭包,装饰器。切片+列表生成式+条件过滤+多层表达式

切片(slice)的理解L1=[1,2,3,4,5,6,7,8,9,0]L2=L1[:] #表示从头到尾切片,等价于复制L1L3=L1[:2] #表示从索引0开始,到所有2结束,但是不包括索引2L4=L1[1:4] #表示将L1中索引为1,2,3的元素复制到L4L5=L1[-4:-1]#倒序切片字符串以可以使用上面的切片。range() 函数可创建一个整数列表,一...

2019-10-05 23:08:11 117

原创 python培训 第八课,模块和包。

在Python中,一个.py文件就称之为一个模块(Module)。好处大大提高了代码的可维护性避免函数名和变量名冲突Python又引入了按目录来组织模块的方法,称为包(Package)。每一个包目录下面都会有一个__init__.py的文件,这个文件是必须存在的,否则,Python就把这个目录当成普通目录,而不是一个包。__init__.py可以是空文件,也可以有P...

2019-10-04 23:19:08 97

原创 python培训 第七课,异常处理。捕获异常,异常的传递,自定义异常。

异常处理防止程序意外终止。这就需要我们捕获异常,然后分析异常,最后指导我们正确地完成处理任务。捕获异常try: <语句>except: print('异常说明')捕获指定异常try: <语句>except <异常名>: print('异常说明')万能异常:try: ...

2019-10-04 23:05:28 118

原创 python培训 第六课,面向对象。类的定义,创建,属性的添加和获取,私有方法,属性,继承,多态,类方法,对象方法,静态方法。

类:python中一切皆为对象,类型的本质就是类在python中,用变量表示特征,用函数表示技能,因而具有相同特征和技能的一类事物就是‘类’,对象是则是这一类事物中具体的一个。定义类是通过class关键字:class Student(object): passpython中定义class的时候,有object和没有object的不同?例如:class Soluti...

2019-10-04 22:37:46 129

原创 python培训 第五课,文件操作。

使用open()函数来打开一个文件, 获取到文件句柄打开文件的方式: r, w, a, r+, w+, a+, rb, wb, ab, r+b, w+b, a+b 默认使用的是r(只读)模式需要注意encoding表示编码集. 根据文件的实际保存编码进行获取数据, 对于我们而言. 更多的是utf-8.在rb模式下. 不能选择encoding字符集.rb的作用: 在读取非文本文件的时候....

2019-10-04 21:07:04 91

原创 python培训 第四课,函数,函数定义,调用,匿名函数,不定长参数,递归函数,可变/不可变类型。

定义: 函数是指将一组语句的集合通过一个名字(函数名)封装起来,要想执行这个函数,只需调用其函数名即可。函数的好处1、简化代码2、提高代码的复用性3、代码可扩展定义函数使用def关键字,后面是函数名,函数名不能重复def fun():#定义一个函数,后面是函数名 print("Hello World")#函数体函数在调用的时候,可以传入参数,...

2019-10-04 20:46:40 182

原创 python培训 第三课,容器、迭代器、生成器

容器(container)容器是一种把多个元素组织在一起的数据结构,容器中的元素可以迭代获取,可用in, not in关键字判断元素是否包含在容器中。在Python中,常见的容器对象有:list(列表),set(集合),dict(字典),tuple(元组),str(字符串)(也有相关资料说str是原子类型数据,不属于容器范畴)等。 可迭代对象(iterable)很多容器都是可迭代对象,...

2019-10-03 23:34:30 179

原创 python培训 第二课,条件控制,循环语句,break,continue,比较关系运算,逻辑运算,三目运算。

条件控制,循环语句具体内容参照下面的博客。https://www.cnblogs.com/gzhjj/p/10661008.html#_caption_0https://blog.csdn.net/sxau_zhangtao/article/details/96495278除了if有else之外,for/while循环也有else。需要注意的是有else的循环,break语句终止循...

2019-10-03 15:34:45 165

原创 python培训 第一课,变量,标识符,关键字,输入输出,数据类型及转换。

变量python中,变量在使用之前不会被创建。赋值的时候才会根据等号右侧的值,自动推测变量的数据类型。标识符标识符就是变量名、函数名。命名规则如下:由字母、数字和下划线组成不能以数字开头不能与关键字重名注意:python中的标识符是去区分大小写的标识符约定俗成的命名规范(1)在定义变量时,为了保证代码格式,“=”的左右应该各保留一个空格(2)在pytho...

2019-10-03 14:56:13 264

原创 辅助工具之VBA(四)按照自定义模版读取文件内容。

有一些项目中,偏好用excel进行数据收集和品质管理等。针对每个机能就会有一套管理文件。制造review票,测试式样书,测试式样的review票,测试结果的review票等等。用不了多久就会有很多文件。项目中期,有可能随时对这些票据进行统计,调查。但是一个一个打开文件未免过于麻烦。怎么办。很多时候我们只是查看每个文件的固定位置的内容。针对这类问题,我觉得有必要设计一个VBA工具来辅助我们轻...

2019-02-27 22:08:42 382

原创 辅助工具之VBA(三)

要实现自动化。所有的Bean等命名都需要遵循统一的命名规则,使用相同的字典。这样才能进一步实现一系列自动化。简单说说算法。做工具,是练习算法设计的好方法。上回书说,生成断言,和把数据绑定到对象中。这些都是基于上回的提到的二维表结构。遍历二维表,然后把数据拼接成我们想要的工具。1,遍历二维表。怎么遍历呢?因为横向数据代表一个完整的对象,所以第一层循环要循环行。第二层循环要循环列,把项...

2019-01-23 23:43:43 278

原创 辅助工具之VBA(二)

工欲善其事,必先利其器。如何用VBA提高我们的效率。这次列举几个实际的例子。单体测试阶段,我们可能需要写大量的重复代码。有时候需要为整理代码注释而精疲力竭。这个阶段我们可以利用VBA来导入导出数据,生产入力数据,生成断言,制造全满位数据等等。在此之前我要先介绍一下excel中数据的格式约定。物理表名 表的显示名   字段1的汉字名 字段2的汉字名 字段n的...

2019-01-07 23:09:04 1287

原创 辅助工具之VBA(一)

工欲善其事,必先利其器。excel可以理解成一个微型数据库,既能存储数据有能很好的呈现数据。拥有丰富的公式,强大的VBA,是我们日常最强大的工具之一。根据excel的特点,我们可以利用它自动生成代码。丰富的公式+VBA,我们可以做数据分析。文档结构形式是一切的基础。约定优于配置。我们要积累一些代码块,在我们需要的时候我们可以快速地组合起来完成想要的功能。1,单元格的遍历。根...

2018-12-21 22:12:51 2810

原创 数据库差分

场景:两年前的一个项目。数据库是sqlserver。客户经常把自己数据库dump发送过来,具体数据库有什么变化也不详细说明。经常,dump导入之后,程序就各种挂。因此就需要在导入之前做一个数据库的差分。看看有哪些不一样的。数据库里有几百个表,人工做太难了。问题:比较两个数据库所有表的结构差异。方案:做一个小工具来完成这件事情。首先想到的是VBA,考虑效率pass,然后先利用C#,短时间也做...

2018-12-12 21:59:27 1698

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除