![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
笔记
文章平均质量分 88
sjt2015
这个作者很懒,什么都没留下…
展开
-
Python爬虫requests库的用法示例
requests库加BeautifulSoup的技术路线。 以采集遵义公共资源交易中心土地出让成交公共数据为例。采集的是公告内容的详情页。 import datetime import numpy as np import pandas as pd import requests from bs4 import BeautifulSoupdef gethttptext(url,head): #获取网页HTML源码,成功返回soup,失败返回空值。 try: r=requests.get(url,he原创 2022-06-10 15:39:12 · 426 阅读 · 0 评论 -
2020-11-30
import pandas as pd df=pd.read_excel(“工作簿1.xlsx”,sheet_name=0,header=None) i=5 while i<=21: col_name=df.loc[1,i] j=0 for j in [i,i+1,i+2]: df.loc[1,j]=col_name+"_"+df.loc[2,j] i=i+3 if i==14: i=i+1 df.rename(columns=df.loc[1],inplace=True) df.drop(label原创 2020-11-30 23:55:57 · 92 阅读 · 0 评论 -
学习笔记,python读取文件夹下所有电子表格文件
import os import xlrd import pandas as pd def file_path(file_dir): file_list = [] for root, dirs, files in os.walk(file_dir): for file in files: if os.path.splitext(file)[1] == ‘.xlsx’ or os.path.splitext(file)[1] == ‘.xls’: file_list.append(os.path.join(r原创 2020-11-26 23:22:17 · 1258 阅读 · 0 评论 -
jieba对word文档词频分析
import docx import jieba from collections import Counter import pandas as pd import xlwt document=docx.Document(r"C:\Users\fj\Desktop\讲话稿.docx") content=" ".join([para.text for para in document.paragraphs]) seg_list=jieba.cut(content,cut_all=False) seg_lis原创 2020-11-26 21:53:48 · 504 阅读 · 0 评论 -
python将pandas数据写入sqlserver数据库示例
python将pandas数据写入sqlserver数据库示例 import pandas as pd import pyodbc import sqlalchemy engin=sqlalchemy.create_engine(“mssql+pyodbc://sa:123@testdb”) data=pd.read_excel(r"E:\anzhuo\qcm_batch_search.xlsx") data.to_sql(“单位名称”,engin,index=False,if_exists=‘append原创 2020-11-25 22:35:52 · 2729 阅读 · 0 评论 -
2020-03-28
求助,oracle安装过程中,报错ora-03113错误。卸载后,清理注册表项后,再重新安装,仍旧报错ora-03113。原创 2020-03-28 21:34:54 · 89 阅读 · 0 评论