自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 朴素贝叶斯算法分类

使用朴素贝叶斯算法进行新闻分类本文使用sklearn中的数据集20newsgroups1. 解决20newsgroups下载缓慢甚至出错的问题在获取数据阶段,下载十分缓慢,等了好久没有反应,索性自己下载了操作,在执行下面代码的时候会有数据下载链接from sklearn import datasetsnews = datasets.fetch_20newsgroups(subset='all')## Downloading 20news dataset. This may take a few

2021-01-14 14:13:42 331 3

原创 泰坦尼克存活预测-KNN

kaggle项目-泰坦尼克存活预测此文代码都是在Jupyter notebook运行的;主要步骤:1.数据获取 ;2. 数据预处理 ;3. 数据集拆分 ;4. 特征工程–无量钢化 ;5. 算法–模型 ;6. 模型评估;7. 最终预测由于博主目前只学习了KNN算法,所以本次就用KNN算法实现预测。1) 获取数据train_data=pd.read_csv('./train.csv')train_data.info()从上面的代码块可以看到训练集数据是有空值的,后续数据预处理要处理掉空值以

2020-12-11 17:14:24 842 4

原创 pandas中好用的函数--apply()

python 中的apply()函数在操作过程中,对数据框中的某一列操作读入了一个csv文件,文件中有多列,其中有一时间列(“date”),该列数据格式不一,如“2019-6-19”,“2019/6/18”都存在,此时希望改变时间列,将所有的“-”替换为“/”,且数据框其他列不改变f = lambda x : x.replace("-", "/")df["date"] = df["da...

2019-06-19 11:39:21 506 1

原创 小白记录python学习经历

pd.value_counts()函数在对统计数据出现次数时,pd.value_counts()还挺好用的,此函数默认按照统计次数从大到小排序data=[2,3,4,8,3,4,3]pd.value_counts(data)得到的结果如下:3 34 28 1 2 1...

2019-06-15 15:10:06 136

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除