自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

baoFeng_Li的博客

想捉住夏日萤光,想在内心铸就铮铮铁骨

  • 博客(8)
  • 收藏
  • 关注

原创 《python数据挖掘入门与实践》决策树预测nba数据集

前言: 学到决策树预测球队输赢时,按照书中网址去下载数据集,无奈怎么也没下载成功。即使下载了excel文件也是破损的。咱可是学了python的银,那好吧,我就把它爬取下来。(资源在下面)代码:''' 爬取《python数据挖掘入门与实践》提到的nba赛况 https://www.basketball-reference.com/leagues/NBA_2014_game...

2018-02-12 12:14:28 5071 6

原创 python os.path.isfile()因参数问题判断错误

目的: 找出路径坐在的所有python文件(.py结尾),返回列表。 接收的参数是***路径+文件名***,所以不单单是`fname`或者`path`。

2018-02-10 16:00:20 5498

转载 python操作文件,文件夹

前言: 当当当~转载stackoverflow上的答案,学习python操作文件,文件夹的一些栗子。这对于读取文件蛮有用的。这里说明一下,我只记录了python3的。正文: os.listdir(): get files in current dir (Python 3)>>> import os>>> arr = os.listdir()>...

2018-02-10 15:06:23 336

原创 Python练习-合并excel表格

前言: 这个栗子本来打算是要合并自己下载的数据集,但是尝试了好久!!才发现是.xls文件损坏了…我忍…在练习过程遇到不少bug,若是小伙伴有疑问可以提一提,说不定我遇到过,恍恍惚惚…代码:''' #excel_combine.py 操作:实例化Excel_Combine_tool(),参数有2个:文件夹位置,表单名字 再save()方法 说明:代码中pr...

2018-02-10 14:43:20 600 1

原创 Python爬取足球网站赛况

前言: 本次爬取数据本意为了作为学习决策树,但发现构造特征时因不了解足球赛制,难以构造出较好的特征。如果有小伙伴也对这个感兴趣的话就和我交流交流吧~~代码:''' #get_tata.py 获取uhchina.com的14-15西甲赛况(未作清洗) 关键是观察爬取数据的情况'''from urllib.request import urlopenfrom bs4 impo...

2018-02-09 19:37:00 4052

原创 遍历函数iterrows()和enumerate()

iterrows():说明:是属于DataFrame(数据框)的遍历函数使用:一般与循环搭配for index, row in dataframe.iterrows(): ...返回:(index,row)对enumerate():说明: enumerate()是python的内置函数,同时获得索引和值使用:一般与循环搭配for index,item in

2018-02-06 20:18:26 10860

原创 Sklearn库的train_test_split()

作用:将数据集随机划分为训练集和测试集使用:X_train,X_test,Y_train,Y_test = train_test_split(X,Y,random_state = 0)返回:X_train,X_test,Y_train,Y_test参数: X:原始数据集中的样品特征 Y:原始数据集中的预测结果 random_state:该组随机数的编号,重复划分时一样的数值保证

2018-02-06 17:50:12 605

原创 Python的numpy模块之zeros()

使用:import numpy as np np.zeros((数组形状),dtype,older)返回:一个指定形状的数组,其元素为0的指定type参数:数组形状:(5,) (5,5) dtype: ‘float’, ‘int’… older: C表示行优先,F表示列优先(可选参数)例子: np.zeros(2) -------->array([0., 0

2018-02-06 16:43:58 13381

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除