- 博客(58)
- 资源 (3)
- 收藏
- 关注
原创 python awesome code
原因是,L 中的每一个元素都是一个 lambda 函数,这些 lambda 函数都使用了外部变量 i,而 i 的值在循环结束后是 4,因此每个 lambda 函数中 i 的值都是 4。在这段代码中,使用 lambda 表达式创建了一个带有一个参数 x 的函数,函数的返回值是 x 乘以 i。在 lambda 表达式中,可以访问外部作用域中的变量,这被称为变量捕获。代码中,lambda 表达式访问了循环中定义的变量 i,而这个变量在循环结束后的值是 4,因此每个 lambda 函数中 i 的值都是 4。
2023-06-02 14:29:17 677
原创 python 编程技巧&高阶函数
接受一个函数和一个可迭代对象作为参数,将函数应用于可迭代对象的前两个元素,然后将函数返回值与第三个元素应用于函数,以此类推,最终返回一个值。接受一个函数和一个可迭代对象作为参数,将函数应用于可迭代对象的每个元素,并返回一个新的可迭代对象,其中只包括函数返回值为。接受一个函数和一个可迭代对象作为参数,将函数应用于可迭代对象的每个元素,并返回一个新的可迭代对象。单下划线表示变量或方法是私有的,双下划线表示变量或方法是特殊的,不应该被覆盖。函数的返回值排序,并返回一个新的列表。函数来同时遍历序列的索引和值,
2023-05-26 14:53:20 988
原创 python 处理超大文件
生成器是一种特殊的迭代器,可以通过函数来生成一系列的值,而不需要一次性生成所有值。在处理超大文件时,我们可以编写一个生成器函数来逐行读取文件,然后将每行数据作为生成器的一个值返回。处理超大 Excel 文件的方法与处理超大表格文件类似,也可以使用生成器来逐行读取数据,避免将整个文件读入内存中。此外,对于非常大的 Excel 文件,可能需要使用专业的数据处理工具来处理,例如 Apache Spark 等。当处理超大文件时,使用生成器可以避免将整个文件读入内存中,从而减少内存占用,提高程序的效率。
2023-05-26 14:35:58 2348
原创 python 生成器
Python生成器是一种特殊的函数,它可以在需要时生成一系列值,而不是一次性生成所有值。是 Python 3.3 引入的一个语法,用于简化生成器中的嵌套。它可以将一个可迭代对象中的所有值逐个返回,从而避免了使用嵌套的。但是,如果数据集有某种逻辑,就不必存储在一个列表中,只需编写一个生成器,它将在需要时生成这些值,基本不占用内存。是一种规则或者说方法,普通集合存储的是数据,数据量大的话,内存消耗大,但是规则几乎不占内存。语句可以在生成器函数中提前结束生成器,并将最终的值作为返回值。循环,使代码更加简洁易读。
2023-05-26 10:25:10 2479
原创 python list,dict操作
在 Python 3.7 及以后的版本中,字典是有序的,即插入顺序与遍历顺序一致。方法是直接修改原列表的顺序,而不是创建一个新的翻转后的列表。函数返回的是一个列表,而不是字典,因为字典是无序的。要对字典的键按照字典序(即按照字母顺序)进行排序,可以将字典的键转换为列表,然后使用。输出结果:[1, 1, 2, 3, 3, 4, 5, 5, 5, 6, 9]中的键值对的顺序与插入的顺序一致。列表推导式:使用列表推导式可以快速生成一个新的列表,例如。方法将另一个列表中的元素添加到当前列表的末尾,使用。
2023-05-25 17:19:28 1736
原创 mongodb $lookup 联表查询
通过item字段连接两个集合orders和items,然后使用 $replaceRoot 中的 $mergeObjects 合并成items和orders的连接文档。$lookup 联表查询。
2023-04-11 10:54:24 871
原创 sql表数据到图结构转换服务
4、将结构化的图数据作为最小服务demo数据使用框架使用flask。2、将人物关键字段作为扩展关系进行图结构化。3、生成图结构化数据。
2022-07-21 16:46:33 805 1
原创 python 从Url获取pdf内容:
def getpdfContent(url): import urllib3 import io import PyPDF2 urllib3.disable_warnings() contents = '' # url = 'https://www.apc-paris.com/system/files/file_fields/2022/04/14/apc-trophees-coachcopro-vf.pdf' with urllib3.PoolMa..
2022-04-19 11:29:49 1104
原创 python float 精度 处理
way1:Decimal示例代码:from decimal import DecimalnumStr = '1.13'print('====a', Decimal(numStr) * Decimal('1e8'))print('====b', Decimal(numStr) * Decimal(1e8))print('====c', Decimal(float(numStr)) * Decimal('1e8'))print('====d', Decimal(float(numStr).
2022-04-09 11:36:58 4209 1
原创 PYLTP 0.2.1 centos 6.5安装 过程
way1:pip install pyltp==0.2.1 -iSimple Index结果:安装未成功:中间安装编译过程超长,直接退出了way2:离线安装 :https://github.com/HIT-SCIR/pyltp安装未成功:下载解压之后,python setup.py install 提示一下异常且不会修改:subprocess.CalledProcessError: Command '['cmake', '/usr/neoapi/neo4j/pyltp-mast..
2022-04-06 14:08:25 2016
原创 centos python3 gcc 以及 glibc版本问题
问题详情:OSError: /lib64/libc.so.6: version `GLIBC_2.14' not found (required by /usr/local/python3/lib/python3.7/site-packages/torch/lib/libgomp-a34b3233.so.1)参考:1、Centos6.5升级glibc解决“libc.so.6: version GLIBC_2.14 not found”报错问题_Robin Hu的博客-CSDN博客https.
2022-04-02 17:43:39 3048
原创 python 条件判断 if
# aaa True 1 np.nan pd.isnull(np.nan)# bbb False None 0 [] '' {} () pd.isnull('')python 条件判断 if:正确判断是否执行if a: print('aaa',a)else: print('bbb',a)
2022-03-16 11:34:51 1291
原创 Ubuntu Nemo使用测试
Ubuntu 显卡信息查询=====ubuntu显卡信息查询(wj@py38) zzsn@zzsn:~/wj$ lspci |grep -i vga01:00.0 VGA compatible controller: NVIDIA Corporation Device 2503 (rev a1)=====ubuntu显卡信息查询(wj@py38) zzsn@zzsn:~/wj$ nvidia-smi -lWed Feb 16 12:40:07 2022 +-----------
2022-02-16 12:43:21 1654
原创 Nvidia Nemo 使用笔记
环境:conda 4.5.11 + cuda +1 conda相关:conda:基本应用【查询版本:环境更新:添加镜像:创建新环境:使用】=====查看安装的conda 版本:(base) C:\Users\Administrator>conda -Vconda 4.5.11=====查看当前conda 环境中安装的库:conda env list=====添加镜像:conda config --add channels https://pypi.douban.c.
2022-02-13 14:28:12 2777
原创 正则 常用示例
1、使用示例替换正则匹配到的字符ptn = re.compile(r'\(function (.|\n)*\(\);')content = re.sub(ptn,'',record['内容'].strip())
2022-01-27 14:27:16 269
原创 图数据库 py2neo driver 使用笔记
1、Nodepy2neo.data – Graph data types — py2neo 2021.12、relationshipspy2neo.data – Graph data types — py2neo 2021.13、pathpy2neo.data – Graph data types — py2neo 2021.1 1、路径查询根据起始节点与目标节点查询关系图cypher语句MATCH p=(n)-[*..3].........
2022-01-22 17:48:27 1041 2
原创 mongodb使用笔记
1、 删除操作1 删除某条记录 根据指定字段进行条件查询并删除service操作:db.getCollection('信息源').remove({"_id":ObjectId('61ce030030274229d69b2106')}pymongo操作col.remove({"_id":ObjectId('61ce030030274229d69b2106')}2......
2022-01-17 14:15:33 572
原创 Linux 常用命令笔记
常用系统:ubuntu 16 / centos 6/7服务器类型,命令分类ubuntu 16查询统计类:1、查询当前文件下文件数量ls | wc -w 扩展: 参考:https://blog.csdn.net/a1007720052/article/details/79408681...
2022-01-08 18:17:23 674
原创 图数据库 背景知识
一、数据库排名https://neo4j.com/docs/operations-manual/current/introduction/1、数据库对比Neo4J和JanusGraph比较 特性\数据库名称 Neo4j JanusGraph 是否开源 社区版开源,企业版收费 完全开源 第一版发行时间 2007年 2016年12月【基于TitanDB[2012]】 技术特点 一站式服务、工具齐全 需要开发者自行组合,因此技术门.
2021-12-29 16:02:48 1484
原创 Anaconda 链接 oracle数据库异常:cx_Oracle.DatabaseError: DPI-1047: Cannot locate a 64-bit
win10 新环境 使用anaconda 的cx_Oracle链接服务器上的oracle数据库:异常详情:cx_Oracle.DatabaseError: DPI-1047: Cannot locate a 64-bit Oracle Client library: "The specified module could not be found". See https://cx-oracle.readthedocs.io/en/latest/user_guide/installation.ht.
2021-12-13 14:56:00 696
原创 git push origin master 异常 error: failed to push some refs to ‘https://gitee.com/...
异常详情:$ git push origin masterTo https://gitee.com/bismillah/zzsn_-kgplt_-frontend.git ! [rejected] master -> master (non-fast-forward)error: failed to push some refs to 'https://gitee.com/***'hint: Updates were rejected because a push..
2021-12-08 20:04:03 2677
原创 docker 管理和创建neo4j数据库
1、docker 安装下载Docker Desktop Installer,win10 下载之后双击安装,ubuntu 下直接yum安装参考:Windows Docker 安装 | 菜鸟教程 (runoob.com)2、neo4j 安装docker pull neo4j:4.0.9使用下载后的镜像:docker run -it -d -p 7474:7474 -p 7687:7687 neo4j:4.0.93、数据库创建4、镜...
2021-11-11 10:40:08 1632
原创 python excel处理 pandas 统计重复数据
读取excel文件,并找到重复的数据df = pd.read_excel(r'project.xls',sheet_name='Sheet1')data = {}dupList = [k for k,v in df['title'].value_counts().to_dict().items() if v > 1]print(type(dupList),len(dupList),dupList)for i in dupList: d = df[df['title']==i..
2021-11-04 11:19:43 1424
原创 Centos 6 安装oracle client 远程链接oracle数据库
问题:cx_Oracle.DatabaseError: DPI-1047: Cannot locate a 64-bit Oracle Client library: "/usr/python/oracleClient/instantclient_11_2/lib/libclntsh.so: cannot open shared object file: No such file or directory". See https://cx-oracle.readthedocs.io/en/latest.
2021-10-25 18:16:26 1104
原创 ubuntu docker pull 失败 Error response from daemon: Get https://registry-1.docker.io/v2/
ubuntu 版本:16.04.12docker pull 镜像失败:Error response from daemon: Get https://registry-1.docker.io/v2/: net/http: request canceled while waiting for connection (Client.Timeout exceeded while awaiting headers)测试方法:1、修改/etc/docker/daemon.json文件,并重启doc
2021-10-13 09:58:27 1687
原创 Ubuntu 16.04 LTS ssh 密码验证失败问题
问题:win10 ssh 可以正常链接ubuntu,但是密码验证一直失败。用户密码和root密码全部验证失败。环境:win10secure crtubuntu 16.04 LTS解决方法:方法1:修改ssh配置vi /etc/ssh/sshd_configPermitRootLogin prohibit-password ==>PermitRootLogin yes修改后重启ssh服务/etc/init.d/ssh restart ...
2021-09-26 17:19:03 1603
原创 python 时间字符串比较
时间字符比较方法:import datetimeimport time#way1tms = ['2021-06-17 00:53:00','2021-06-18 00:53:00','2021-06-16 00:53:00','2021-06-19 00:53:00','2021-06-11 00:53:00']print("===way1===")for tm in tms: ntm = time.strptime(tm, "%Y-%m-%d %H:%M:%S") if n.
2021-08-16 16:09:17 2237
原创 python 时间格式处理(读取文件的修改时间,将年月作为文件名)
输入:选择文件输出:文件修改时间的文件名import osimport tkinter as tkfrom tkinter import filedialogprint("选择待处理的文件: ")root = tk.Tk()#创建一个文件窗口root.withdraw()#打开窗口filepath = filedialog.askopenfilename()#获取选择的文件路径#D:/wk/file.xls#获取文件修改时间信息:mtimemtime = os.stat(file
2021-04-13 14:05:17 403
原创 python pandas 批量合并相同列名的csv文件
python 实现过程文件批量合并import pandas as pdimport osdef getFile(path): dirlst= [] dirs = os.listdir(path) for i in dirs: file = os.path.splitext(i)[0] if file.startswith('爬虫_'): filename = path + '\\' + file+'.csv' .
2021-01-31 23:50:40 1820 1
转载 Neo4j配置文件
转载文章来源:http://weikeqin.com/2017/04/05/neo4j-config/配置文件路径:conf/neo4j.conf# 修改第9行,去掉#,修改数据库名dbms.active_database=myNeo4j# 修改第12行,去掉#。修改路径,改成绝对路径dbms.directories.data=C:/WorkSpaces/Neo4j/# 修改9行和12行后,neo4j数据存放在 C:/WorkSpaces/Neo4j/databases/wkq_gr.
2020-12-24 09:56:51 936 1
原创 常用数据库查询结果处理
cx_Oracle 操作oracle数据库:import cx_Oracledef myoracle(): conn = cx_Oracle.connect('user/password@ip:host/ServiceName') # 连自己的数据库,连接参数可以组合写也可以分开写 cur = conn.cursor() sql = "desc table"#查询表结构 cur.execute(sql) selects = cur.fetchall()
2020-12-23 18:11:38 675 1
原创 python list操作
1、按照固定的数量扩展期望list:[1,1,2,2,3,3,4,4]开始list:be = [1,2,3,4]be = [1,2,3,4]af = [val for val in be for i in range(2)]print(af)2、按照一定的序列扩展期望list:[1,1,2,2,3,4,4,4]开始list:be = [1,2,3,4]辅助的list:index=[2,2,1,3]index= [2,2,1,3]af= []n = 0whil
2020-08-24 17:18:39 99
原创 Neo4j 相关操作与异常记录
访问Neo4j出错:Neo.ClientError.Security.Unauthorized: The client is unauthorized due to authentication failure.解决办法:参考文章先关闭数据库的服务端:删除data/dbms/auth,修改配置文件neo4j.conf中的以下内容并保存之后,重新启动之后会提示有风险,选择continue anyway(随便继续)就好。dbms.security.auth_enabled=Fal.
2020-07-21 14:47:58 1916
原创 hadoop环境构建
《Hadoop大数据技术》实验目的安装Java环境 搭建Hadoop单机模式 在hadoop伪分布式基础上搭建Hadoop完全分布式模式环境实验环境Win10+Centos7(Vmware workstation14)+winscpjdk 环境变量配置打开一个terminal窗口,切换到管理员命令,关闭网络防火墙,并取消开机自启防火墙。查找系统自带的openjdk...
2020-06-07 16:31:26 371
原创 Docker 19.03.5 | win10 | playwithdocker |一些小问题
docker 基本用法和命令:Usage: docker [OPTIONS] COMMANDA self-sufficient runtime for containersOptions: --config string Location of client config files (default "C...
2020-05-04 00:35:09 526
原创 Node 安装和Express框架的基本使用
新建项目文件夹ExpressDemo:在命令窗口执行命令安装和使用Express框架1 安装Express框架以及几个重要的模块$ npm install express --save$ npm install body-parser --save$ npm install cookie-parser --save$ npm install multer --save简化...
2020-04-18 13:18:14 196
HONEYCAM-SETUP_2.03.EXE
2019-05-27
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人