暑假学习日记week1
文章平均质量分 54
囧人232
这个人很懒,但是什么都想写
展开
-
sklearn特征抽取
文章目录sklearn特征抽取sklearn安装sklearn特征抽取sklearn 字典特征抽取td-idfsklearn特征抽取流程实例化DictVectorizerfit_transform(x) 输入数据并转化sklearn安装pip install sklearnsklearn特征抽取CountVectorizer(max_df=1.0,min_df=1,…)返回词频矩阵CountVectorizer.fit_transform(X,y)X:文本或者包含文本字符串的原创 2021-01-26 11:37:42 · 216 阅读 · 0 评论 -
pandas学习笔记(二)
文章目录Pandas 数据合并与拼接Merge方法join方法contact方法Pandas 数据合并与拼接df1.append(df2):将df2中的行添加到df1的尾部df.concat([df1, df2],axis=1):将df2中的列添加到df1的尾部df1.join(df2,on=col1,how='inner'):对df1的列和df2的列执行SQL形式的joinMerge方法pandas的Merge方法基于共同列,将两个DataFrame连接起来。有如下参数left/righ原创 2021-01-24 23:39:45 · 152 阅读 · 0 评论 -
Pandas 学习笔记(一)
Pandas 学习笔记(一)文章目录Pandas 学习笔记(一)生成对象查看数据选择缺失值合并分组可视化输入输出生成对象s = pd.Series([1,2,np.nan,5,6])用值列表生成Series时,Pandas默认自动生成整数索引df = pf.DataFrame(np.random.randn(6,4),index=dates,columns=list(‘ABCD’))也可以用Series生成DataFramedf2=({ ‘A’ :1,原创 2021-01-23 00:59:11 · 157 阅读 · 0 评论 -
numpy 学习笔记(一)
文章目录numpy 学习笔记(一)numpy 安装numpynumpy操作对象为多维数组,通常为一个元素表。numpy创建数组numpy中矩阵的运算numpy中ndarray类提供了很多方法数组形状修改广播原则读取csv文件numpy中的nannumpy 学习笔记(一)numpy 安装pip install numpynumpynumpy操作对象为多维数组,通常为一个元素表。t4 = np.array([[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8,原创 2021-01-21 22:33:34 · 62 阅读 · 0 评论 -
matplotlib学习笔记(二)
文章目录怎么绘制一个稍微复杂的图如何设置线条样式设置图例绘制图表底下设置网格怎么绘制一个稍微复杂的图其他图的绘制与折线图大同小异plt.scatter(x,y)#散点图plt.bar(x,y)#柱状图,可用width修改其长度plt.barh(x,y)#横向柱状图,可用height修改其宽度plt.hist(data,20)#直方图,分成20组#直方图适合用于原始数据在一个折线图上绘制两个或者多个折线plt.plot(x,y_1)plt.plot(x,y_2)绘制多个柱状图原创 2021-01-20 20:30:54 · 84 阅读 · 0 评论 -
7/21 python爬虫学习日志(day1)
假期来了,打算重新学一下Python爬虫重装pycharm做几个简单的爬虫做一下这一周的安排和计划重装pycharm昨天晚上装Ubuntu,感觉挺好但是依赖什么的还是用不惯(果然我还是太菜了),但是硬盘分区的时候把D盘清空了,又得再重装一遍需要用到的Pycharm和IDEA(Qt大概率很长一段时间不会再动了,想学别的东西)做几个简单的爬虫复习一下之前学的东西其实当时就没学透,cv工程师石锤首先是一个爬取大学排名的爬虫import requestsimport timefrom l原创 2020-07-22 01:09:17 · 203 阅读 · 0 评论