WuSiYang@001025-CSDN博客

原创输电线路异物检测相关数据集

悬挂在输电线路及杆塔上的鸟巢异物图像，带有增广，带有VOC标签，即xml文件，可用于深度学习目标检测。

2023-07-23 16:37:56 590 1

原创数据可视化-matplotlib运用以及Plotly的使用（附代码）

数据可视化-matplotlib运用1.先从绘制一些简单的图开始绘制简单的折线图演示import matplotlib.pyplot as pltsquares=[1,4,9,16,25]plt.plot(squares)运行结果[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-FEEJtMD5-1595910784525)(/Users/wusiyang/Library/Application Support/typora-user-images/imag

2020-07-28 12:33:31 643

原创厦门国际银行数创金融杯建模大赛

2020厦门国际银行数创金融杯建模大赛baseline分享成绩：0.34比赛地址：https://www.dcjingsai.com/v2/cmptDetail.html?id=439&=76f6724e6fa9455a9b5ef44402c08653&ssoLoginpToken=&sso_global_session=e44c4d57-cd19-4ada-a1d3-a5250252bf86&sso_session=irjO90jPA0%205ytlVRkI1fA%3D

2020-10-30 11:19:44 4741 11

原创大数据比赛——KNN

K-近邻分类K最近邻(k-Nearest Neighbor，KNN)分类算法，是一个理论上比较成熟的方法，也是最简单的机器学习算法之一。该方法的思路是：在特征空间中，如果一个样本附近的k个最近(即特征空间中最邻近)样本的大多数属于某一个类别，则该样本也属于这个类别。KNN算法不仅可以用于分类，还可以用于回归。通过找出一个样本的k个最近邻居，将这些邻居的属性的平均值赋给该样本，就可以得到该样本的属性。更有用的方法是将不同距离的邻居对该样本产生的影响给予不同的权值(weight)，如权值与距离成反比。该算法

2020-07-28 11:50:39 321

原创 Pandas处理缺失值

07.Pandas处理缺失值Pandas使用这些函数处理缺失值：isnull和notnull：检测是否是空值，可用于df和seriesdropna:丢弃，删除缺失值[axis:](删除行还是列，{0 or ‘index’,1or ‘columns’},default 0)删除行还是列，{0 or ‘index’,1or ‘columns’},default 0how:如果等于any则任何值为空都删除，如果等于all则所有值为空值才能删除inplace:如果为True则修改当前df，否则返

2020-07-28 11:35:11 245

原创 Python应用—函数篇

Python应用—函数篇定义函数:def greet_user(): print("hello")greet_user()向函数传递信息： def greet_user(username): print("hello,"+username.title()+"!")greet_user('jesse')在传递信息的时候，注意信息的位置很重要也可以通过关键数定义参数，例如：greet_user(username='jesse')也可以在函数()里定义参数在主程序里面定

2020-07-14 20:45:38 162

原创 Pandas数据统计函数

5.Pandas数据统计函数@汇总类统计@唯一去重和按值计数@相关系数和协方差演示：import pandas as pdfpath="路径"df=pd.read_csv(fpath)#替换符号df.loc[:,"索引列名"]=df["索引列名"].str.replace["C",""].astype("int32")#汇总类统计df.describe()#显示所有数字列df["索引列名"].mean()#查看单个Series的数据df["索引列名"].max()#查看索引列

2020-07-14 20:26:03 350

原创 Pandas新增数据列

5.pandas新增数据列进行数据分析师，经常需要按照一定的条件创建新的数据列，然后进行进一步分析。@直接赋值@df.apply语法@df.assign语法@按条件选择分组分别赋值演示：import pandas as pdfpath="文件位置"df=pd.read_csv(fpath)#直接赋值方法df.loc[:,"索引列名"]=df["索引列名"].str.replace("str","").astype('int32')#替换字符串#这里导入一个实例，计算温差df.l

2020-07-13 11:24:12 1088

原创 Pandas查询数据的5种方法

04.pandas查询数据的5种方法按数值，列表，函数，区间，条件的查询方法（1）查询语法1.df.loc:根据行列的标签值进行查询2.df.iloc:根据行列的位置进行查询3.df.where4.df.query（2）df.loc查询方法@用单个lable值查询数据@使用值列表批量查询@使用数据区间进行范围查询演示import pandas as pddf=pd.read_csv("文件位置")df.head#查看文件前几行数据df.set_index('列名索引',imp

2020-07-13 10:44:51 6454 3

原创 Pandas数据结构

03.Pandas数据结构(1)DataFrame:二维数据，多行多列df.columes(查询列)df.index(查询行)（2）Series：一维数据，一行或一列（3）演示：创建Seriesimport pandas as pdimport numpy as np#创建Series,方法1:S1=pd.Series([1,'a',5.2,7])#若输出S1，左侧为索引，右侧为数据#输入获取索引S1.index#op:start=0,stop=4,step=1#输入获得

2020-07-13 10:43:04 134

原创 Pandas数据读取

02.Pandas数据读取Pandas需要先读取表格类型的数据，然后进行分析（1）数据类型·说明·Pandas读取方法1.csv，txt，tsv：用逗号分隔，tab分隔的纯文本文件，读取方法为pd.read_csv2.excel：微软的xls或者xlsx文件，读取方法为pd.read_excel3.mysql：关系型数据库表，读取方法为pd.read_sql(2)演示import pandas as pd#读取CSVfpath="./datas/rating.csv"ratings=pd

2020-07-13 10:41:25 354

wusiyang001025的博客