自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 python 爬虫 获取本地网页

我这边试过好几种获取本地HTML内容的方法 内容上面如图所示 试过好几种获取网页内容方法 1、 r = requests.get('file:///D:/工作内容/工作内容/单病种质控/病种上报页/病种上报页/DVT%20围手术期深静脉血栓.html') 返回结果为: InvalidSchema: No connection adapters were found for 'file:///D:/工作内容/工作内容/单病种质控/病种上报页/病种上报页/DVT%20围手术期深静脉血栓.html'

2020-09-27 14:39:22 1044

原创 条件删除重复行

python pandas 想要条件删除某一字段重复的行 起初是想直面解决,没有找到合适的方法,因此曲线救国,将DATAFRAME groupby ,然后按照你想要给与条件的列 排序(ascending或者DESC),然后再删除,保留第一个 ##先将数据根据'is_valid'进行排序,将肯定的排序在第一行,(其中head(1)是将groupby后的dataframe取第一个) checks_result_dvt_g=checks_result_dvt.groupby('visit_id').h.

2020-09-10 14:06:02 356

原创 从txt当中自动获取变量DSL

-- coding: utf-8 -- “”" Created on Sat Aug 15 15:06:49 2020 @author: synyi “”" import pandas as pd import numpy as np import os import re ##生产路径 os.chdir(r’D:\工作内容\工作内容\DSL自动生产’) ##取数逻辑文件 path=r’D:\工作内容\工作内容\DSL自动生产\DSL汇总.xls’ logit=pd.read_excel(path,shee

2020-08-15 19:25:42 214

原创 openpyxl 读取文件,pandas 读取文件,检验值测试case自动化

# -*- coding: utf-8 -*- """ Created on Tue Jul 14 10:53:20 2020 @author: synyi """ ## 该文件为给检验_值 的变量写测试case import pandas as pd import numpy as np import os import openpyxl from openpyxl.utils.dataframe import dataframe_to_rows import re ## 将文件路径设置为取数逻辑和模

2020-07-14 17:03:38 412

原创 DSL自动生产python 代码---诊断diag模块

DSL生产一直比较重复,目前针对诊断相关变量重复生产的情况,进行优化,有两种方案 1、按照原来DSL生产逻辑 python代码如下: import pandas as pd import numpy as np import os os.chdir(r'D:\工作内容\工作内容\评级\2020.0703儿科新增内容术语') logit=pd.read_excel(r'D:\工作内容\工作内容\评级\2020.0703儿科新增内容术语\评级七级儿科新增内容\儿科汇总.xlsx') 这块可以根...

2020-07-09 16:20:01 402

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除