龚丽春-CSDN博客

原创 python 爬虫获取本地网页

我这边试过好几种获取本地HTML内容的方法内容上面如图所示试过好几种获取网页内容方法 1、 r = requests.get('file:///D:/工作内容/工作内容/单病种质控/病种上报页/病种上报页/DVT%20围手术期深静脉血栓.html') 返回结果为： InvalidSchema: No connection adapters were found for 'file:///D:/工作内容/工作内容/单病种质控/病种上报页/病种上报页/DVT%20围手术期深静脉血栓.html'

2020-09-27 14:39:22 1044

原创条件删除重复行

python pandas 想要条件删除某一字段重复的行起初是想直面解决，没有找到合适的方法，因此曲线救国，将DATAFRAME groupby ,然后按照你想要给与条件的列排序（ascending或者DESC），然后再删除，保留第一个 ##先将数据根据'is_valid'进行排序，将肯定的排序在第一行，（其中head(1)是将groupby后的dataframe取第一个） checks_result_dvt_g=checks_result_dvt.groupby('visit_id').h.

2020-09-10 14:06:02 356

原创从txt当中自动获取变量DSL

-- coding: utf-8 -- “”" Created on Sat Aug 15 15:06:49 2020 @author: synyi “”" import pandas as pd import numpy as np import os import re ##生产路径 os.chdir(r’D:\工作内容\工作内容\DSL自动生产’) ##取数逻辑文件 path=r’D:\工作内容\工作内容\DSL自动生产\DSL汇总.xls’ logit=pd.read_excel(path,shee

2020-08-15 19:25:42 214

原创 openpyxl 读取文件，pandas 读取文件，检验值测试case自动化

# -*- coding: utf-8 -*- """ Created on Tue Jul 14 10:53:20 2020 @author: synyi """ ## 该文件为给检验_值的变量写测试case import pandas as pd import numpy as np import os import openpyxl from openpyxl.utils.dataframe import dataframe_to_rows import re ## 将文件路径设置为取数逻辑和模

2020-07-14 17:03:38 412

原创 DSL自动生产python 代码---诊断diag模块

DSL生产一直比较重复，目前针对诊断相关变量重复生产的情况，进行优化，有两种方案 1、按照原来DSL生产逻辑 python代码如下： import pandas as pd import numpy as np import os os.chdir(r'D:\工作内容\工作内容\评级\2020.0703儿科新增内容术语') logit=pd.read_excel(r'D:\工作内容\工作内容\评级\2020.0703儿科新增内容术语\评级七级儿科新增内容\儿科汇总.xlsx') 这块可以根...

2020-07-09 16:20:01 402