自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(25)
  • 收藏
  • 关注

原创 seaborn学习笔记

seaborn是一个绘图库,在泰坦尼克数据中使用到,因此进行学习。seaborn的参考文档地址:http://seaborn.pydata.org/api.html用思维导图绘制学习路径:

2020-02-22 09:19:01 185

原创 作用域和变量 :全局作用域 全局变量 局部作用域 局部变量

全局变量与局部变量:attention:1调用函数时,Python 会优先在局部作用域内寻找变量,找不到再去外层的全局变量寻找,如果都找不到则报NameError的错误# 这里的 rule 在函数外是全局变量rule = '965 工作制'def busy_company(): # 这里的 rule 在函数内是局部变量 rule = '996 工作制' pri...

2020-02-19 10:45:37 696

原创 函数:位置参数 关键词参数 默认参数

位置参数举例:def func(name, age, height, weight): print('name =', name) print('age =', age) print('height =', height) print('weight =', weight)func('小贝', 18, '155cm', '40kg')# 输出:# name = 小贝...

2020-02-19 09:54:05 272

原创 20200101

1清理C盘,看到知乎上一个很好的回答,在给系统盘瘦身之前先搞清楚系统盘中哪一块是占比最大的,然后进行定点处理。这里使用了一个软件叫做windirstat2处理了ti+ab的数据 从头做实验...

2020-01-01 15:55:37 168

原创 NumPy基础:数组与向量化计算

1.多维数组对象1.1生成ndarray1.2ndarray的数据类型1.3numpy数组算术numpy的向量化即为对numpy中的数据进行批量操作不需要for循环arr = np.array([[1,2,3],[4,5,6]])arr*arrOut[37]: array([[ 1, 4, 9], [16, 25, 36]])arr*3Out[...

2019-10-28 19:11:52 183

原创 机器学习笔记--回归 线性回归&多项式回归--房屋面积与房价的关系

1.数据集两列数据,分别是房屋面积和房屋价格2.回归回归的分类:一般分为线性回归(Linear Regression), 多项式回归(Ploynomial Regression), 岭回归(Ridge Regression),Lasso回归和弹性回归网络(ElasticNet Regression).具体介绍参考https://blog.csdn.net/u013181595/ar...

2019-10-28 17:51:19 1340

原创 机器学习笔记--分类 决策树--人体运动状态信息评级

1.数据集参考https://blog.csdn.net/qq_39011567/article/details/102732543对数据集的介绍2.决策树算法分析参考https://blog.csdn.net/qq_20106375/article/details/94158472对决策树算法的介绍3.实验过程1、使用算法:DecisionTreeClassifier分类算法...

2019-10-28 17:29:14 586

原创 机器学习笔记--分类 朴素贝叶斯--人体运动状态信息评级

1.数据集1.1data每个sample有41个feature,41个feature对应的信息分别如下所示共计6个文件,A.feature、B.feature、C.feature、D.feature、E.feature、F.feature1.2target共计6个文件,A.label、B.label、C.label、D.label、E.label、F.l...

2019-10-24 21:25:59 925 4

原创 机器学习笔记--分类KNN--基于鸢尾花数据集

1.数据集参考https://blog.csdn.net/qq_39011567/article/details/102657280对鸢尾花数据集的介绍2.KNN算法分析  1)计算测试数据与各个训练数据之间的距离;  2)按照距离的递增关系进行排序;  3)选取距离最小的K个点;  4)确定前K个点所在类别的出现频率;  5)返回前K个点中出现频率最高的类别作为测试数...

2019-10-24 21:25:09 324

原创 sklearn学习笔记

希望能做成思维导图的形式。机器学习包括监督学习和无监督学习,监督学习一般为分类与回归,无监督学习一般分为聚类与降维。1.sklearn数据集1.1数据集介绍数据集是一个类似字典的对象,它保存有关数据的所有数据和一些元数据。 该数据存储在.data成员中,它是n_samples, n_features数组。 在监督问题的情况下,一个或多个响应变量存储在.targ...

2019-10-24 11:30:14 192

原创 机器学习笔记--降维 PCA--基于鸢尾花数据集

1.数据集使用skleaen.datasets自带的鸢尾花数据集进行PCA降维首先,导入IRIS鸢尾花数据集:from sklearn.datasets import load_iris其次,对鸢尾花数据集进行探索:iris = load_iris()X = iris.datay = iris.targetiris.data是一个四维的数据集,iris.target...

2019-10-21 11:15:44 2117

原创 机器学习笔记--聚类算法 k-means--31省市消费水平聚类

参考文章:https://blog.csdn.net/rankiy/article/details/998433631.数据集数据介绍:现有1999年全国31个省份城镇居民家庭平均每月全年消费性支出 的八个主要变量数据,这八个变量分别是食品、衣着、家庭设备用品、服务、医疗保健、交通、通讯、娱乐教育文化服务、居住以及杂项商品和服务。利用已有数据,对31个省份进行聚类。北京,2959...

2019-10-19 11:32:53 5690 1

原创 Python爬虫-专业数据库书名爬取

1需求分析:获取情报学学科可参考的相关的书目名称2抓取对象:在超星数据库读秀数据库中检索,选取读书检索,输入目次字段为“情报学”检索结果如下:3源码分析:查看源代码页,找到图书标题所在的代码行对应行为:<a href="bookDetail.jspdxNumber=000007693132&d=77F50C9B5C833446AF6D59...

2019-09-28 12:09:28 1659

原创 NLP-one-hot编码to_categorical()函数

https://blog.csdn.net/moyu123456789/article/details/83444140 先马下参考文章

2019-09-17 15:31:57 330

原创 NLP-序列预处理pad_sequences()函数

https://blog.csdn.net/wcy23580/article/details/84957471 先马下参考文章

2019-09-17 15:30:25 1292

原创 pycharm console配置

1.pycharm中console和terminal的区别原文链接:https://blog.csdn.net/qq_36309480/article/details/82702021Pycharm的下方工具栏中有两个窗口:Python Console和Terminal其中,Python Console叫做Python控制台,即Python交互模式;Terminal叫做终端,即命令行模...

2019-09-17 12:36:01 8193

原创 机器学习笔记--classification_report&精确度/召回率/F1值

精确度/召回率/F1值,即precision/recall/f1-scorehttps://blog.csdn.net/akadiao/article/details/78788864给以下一组数据进行解释:真实值:1 2 3 1 2 1 2 1 1 3 4 3预测值:1 1 2 3 2 1 2 4 2 3 4 21的精准度等于:2/3(真实值和预测值相匹配的案例数/预测...

2019-09-08 17:23:32 481

原创 Python 可变对象与不可变对象

https://www.cnblogs.com/harvyxu/p/8535930.html1.不可变类型(数字,字符串,元组,不可变集合):不支持原处修改2.可变类型(列表,字典,可变集合):可以通过操作原处修改,而不用创建新的对象...

2019-08-31 10:04:30 82

原创 Python 输入的100个问题

1.输入包含多个测试样例,每组样例占一行,包含一个整数,输入到文件末尾结束(如下图)。101001000解题思路: lines=[] while True: line = input() if not line: break lines.append(line) li...

2019-08-27 21:32:20 217

原创 【Python数据分析】气象数据分析

import numpy as npimport pandas as pdimport matplotlib.pyplot as plt读文件(文件包含结构化数据):df_ferrara = pd.read_csv(r'C:\Users\zhang\Desktop\WeatherData\ferrara_270615.csv',encoding='utf-8')取数据...

2019-08-23 19:49:25 1576

原创 【Python数据分析】性别差异对电影评分差异度的影响

数据描述:u.user是评分者的基本身份信息文件内容示例如下:五列数据分别表示用户编号、年龄、性别、职业、zip codeu.data是评分者对电影评分的信息文件内容示例如下:四列数据分别表示用户编号、电影编号、评分、时间戳源代码:import pandas as pdimport numpy as np#从原始文件中读入数据user = ['user i...

2019-05-16 21:20:39 1533

原创 Python爬虫笔记

爬取 import requests #导入requests模块1.发送请求import requestsr=requests.get('http://www.dianping.com/')2.定制headers这种情况适用于爬取返回的结果出现“抱歉”“无法访问”等字眼时,这时需要模拟一个界面服务器自行爬取的状态import requestsheaders={"...

2019-05-14 20:09:09 123

原创 Python数据分析笔记

DataFrame某一列数据类型更改:aDF[['high','low']] = aDF[['high','low']].astype(int)

2019-05-09 11:11:04 198

原创 Python基础部分笔记( 输入和输出)

输入部分:1.用逗号隔开1.1得到单个整型'''输入:1,2,3输出:x=1 y=2 z=3'''x,y,z= eval(input())#eval是用来将形式化表达式(字符类型)转化为对应的运算结果'''x,y,z=[int(x) for x in input().split(',')]1.2得到整型列表'''输入:1,2,3输出:x=[1,2,3...

2019-05-09 11:05:54 281

原创 《浪潮之巅》读书笔记

首先,书的前面“读者赞誉”栏目里面将一些大学教授、网站总监、公司CTO、投资经理这样的专业人士和豆瓣网友的读书反馈交叉地铺陈在一起,就已经令我产生极大的好感了。第1章 帝国的余晖 2019/4/28“我在Google总部曾接待了很多中国政府的领导干部,他们都关心为什么美国小公司能很快成为跨国企业,我认为其中一个原因是反垄断法逼着公司追求技术进步。当一家公司开始垄断一个行业时,他...

2019-04-28 19:19:24 281

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除