- 博客(5)
- 收藏
- 关注
原创 python 爬虫 获取本地网页
我这边试过好几种获取本地HTML内容的方法内容上面如图所示试过好几种获取网页内容方法1、r = requests.get('file:///D:/工作内容/工作内容/单病种质控/病种上报页/病种上报页/DVT%20围手术期深静脉血栓.html')返回结果为:InvalidSchema: No connection adapters were found for 'file:///D:/工作内容/工作内容/单病种质控/病种上报页/病种上报页/DVT%20围手术期深静脉血栓.html'
2020-09-27 14:39:22
968
原创 条件删除重复行
python pandas 想要条件删除某一字段重复的行起初是想直面解决,没有找到合适的方法,因此曲线救国,将DATAFRAME groupby ,然后按照你想要给与条件的列 排序(ascending或者DESC),然后再删除,保留第一个##先将数据根据'is_valid'进行排序,将肯定的排序在第一行,(其中head(1)是将groupby后的dataframe取第一个)checks_result_dvt_g=checks_result_dvt.groupby('visit_id').h.
2020-09-10 14:06:02
293
原创 从txt当中自动获取变量DSL
-- coding: utf-8 --“”"Created on Sat Aug 15 15:06:49 2020@author: synyi“”"import pandas as pdimport numpy as npimport osimport re##生产路径os.chdir(r’D:\工作内容\工作内容\DSL自动生产’)##取数逻辑文件path=r’D:\工作内容\工作内容\DSL自动生产\DSL汇总.xls’logit=pd.read_excel(path,shee
2020-08-15 19:25:42
166
原创 openpyxl 读取文件,pandas 读取文件,检验值测试case自动化
# -*- coding: utf-8 -*-"""Created on Tue Jul 14 10:53:20 2020@author: synyi"""## 该文件为给检验_值 的变量写测试caseimport pandas as pdimport numpy as npimport osimport openpyxlfrom openpyxl.utils.dataframe import dataframe_to_rowsimport re## 将文件路径设置为取数逻辑和模
2020-07-14 17:03:38
361
原创 DSL自动生产python 代码---诊断diag模块
DSL生产一直比较重复,目前针对诊断相关变量重复生产的情况,进行优化,有两种方案1、按照原来DSL生产逻辑python代码如下:import pandas as pdimport numpy as npimport osos.chdir(r'D:\工作内容\工作内容\评级\2020.0703儿科新增内容术语') logit=pd.read_excel(r'D:\工作内容\工作内容\评级\2020.0703儿科新增内容术语\评级七级儿科新增内容\儿科汇总.xlsx')这块可以根...
2020-07-09 16:20:01
339
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人