Python
文章平均质量分 64
Python
后端码匠
道阻且長,行則將至
展开
-
Python实现控制台清屏
print('\033c',end='')如果有同学用C语言实现过一些改变控制台字符颜色等功能的小程序就会知道,\33开头这样的控制码可以修改很多控制台的输出属性,上面的\033c其实就是清屏指令。需要注意此函数调用效果命令和Linux下的clear有些不同。 clear相当于整个屏幕上移,而输出\033c,或直接把屏幕的内容清空,之前输出的内容也会全部消失不见。...原创 2021-10-11 15:55:47 · 1792 阅读 · 0 评论 -
【机器学习】特征工程
目录数据集可用数据集sklearn数据集特征提取字典文本特征预处理无量纲化归一化标准化特征降维特征选择主成分分析(PCA降维)数据集下面列举了一些示例来说明哪些内容能算作数据集:包含某些数据的表格或 CSV 文件组织有序的表格集合采用专有格式的文件,其中包含数据可共同构成某个有意义数据集的一组文件包含其他格式的数据的结构化对象,您可能希望将其加载到特殊工具中进行处理捕获数据的图原创 2021-08-13 22:36:11 · 611 阅读 · 2 评论 -
机器学习-sk-learn-Facebook数据集预测签到位置
sk-learn Facebook数据集预测签到位置本次比赛的目的是预测一个人将要签到的地方。 为了本次比赛,Facebook创建了一个虚拟世界,其中包括10公里*10公里共100平方公里的约10万个地方。对于给定的坐标集,我们的任务将根据用户的位置,准确性和时间戳等预测用户下一次的签到位置。 数据被制作成类似于来自移动设备的位置数据。特征值:“x”, “y”, “accuracy”, “day”, “hour”, “weekday”目标值: place_id本实例使用Facebook上统计的数据原创 2021-08-13 14:52:46 · 937 阅读 · 7 评论 -
【机器学习】K-近邻算法-模型选择与调优
前言在KNN算法中,k值的选择对我们最终的预测结果有着很大的影响那么有没有好的方法能够帮助我们选择好的k值呢?模型选择与调优目标说明交叉验证过程说明参数搜索过程应用GirdSearchCV实现算法参数的调优应用Facebook 签到位置预测调优什么是交叉验证(cross validation)定义将拿到的训练数据,分为训练和验证集,以下图为例:将数据分成4份,其中一份作为验证集,然后经过4次(组)的测试,每次都更换不同的验证集,即得到4组模型的结果,取平均值作为最终结原创 2021-08-13 10:51:12 · 941 阅读 · 1 评论 -
【机器学习】特征提取
特征提取目标应用DictVectorizer实现对类别特征进行数值化、离散化应用CountVectorizer实现对文本特征进行数值化应用TfidfVectorizer实现对文本特征进行数值化说出两种文本特征提取的方式区别定义特征提取是将任意数据(如文本或图像)转换为可用于机器学习的数字特征注:特征值化是为了计算机更好的去理解数据字典特征提取(特征离散化)文本特征提取图像特征提取(深度学习)特征提取APIsklearn.feature_ext原创 2021-08-11 10:19:36 · 2808 阅读 · 2 评论 -
【机器学习】机器学习概述
简单的一句话:让机器从数据中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好,这就是机器学习。机器学习是实现人工智能的一种途径,它和数据挖掘有一定的相似性,也是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。对比于数据挖掘从大数据之间找相互特性而言,机器学习更加注重算法的设计,让计算机能够白动地从数据中“学习”规律,并利用规律对未知数据进行预测。因为学习算法涉及了大量的统计学理论,与统计推断联系尤为紧密,所以也被称为统计学习方法。机原创 2021-08-11 09:20:36 · 283 阅读 · 0 评论 -
【机器学习】特征降维-特征选择
特征选择什么是特征选择定义: 数据中包含冗余或无关变量(或称特征、属性、指标等),旨在从原有特征中找出主要特征。方法:Filter(过滤式):主要探究特征本身特点、特征与特征和目标值之间关联方差选择法:低方差特征过滤相关系数Embedded (嵌入式):算法自动选择特征(特征与目标值之间的关联)决策树:信息熵、信息增益正则化:L1、L2深度学习:卷积等Wrapper (包裹式)模块sklearn.feature_selection过滤式低方差特征过滤原创 2021-08-11 09:01:24 · 354 阅读 · 0 评论 -
【机器学习】特征降维-主成分分析
主成分分析目标应用PCA实现特征的降维应用:用户与物品类别之间主成分分析什么是主成分分析(PCA)定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量作用:是数据维数压缩,尽可能降低原数据的维数(复杂度),损失少量信息。应用:回归分析或者聚类分析当中那么更好的理解这个过程呢?我们来看一张图APIsklearn.decomposition.PCA(n_components=None)将数据分解为较低维数空间n_components:小数:原创 2021-08-11 08:58:51 · 325 阅读 · 0 评论 -
【机器学习】特征预处理
学习目标了解数值型数据、类别型数据特点应用MinMaxScaler实现对特征数据进行归一化应用StandardScaler实现对特征数据进行标准化1、什么是特征预处理特征预处理:通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程可以通过上面那张图来理解1.1 包含内容数值型数据的无量纲化:归一化标准化1.2 特征预处理APIsklearn.preprocessing为什么我们要进行归一化/标准化?特征的单位或者大小相差较大,或者某特征的原创 2021-08-11 08:52:33 · 224 阅读 · 0 评论 -
【机器学习】特征降维
特征降维学习目标知道特征选择的嵌入式、过滤式以及包裹氏三种方式应用VarianceThreshold实现删除低方差特征了解相关系数的特点和计算应用相关性系数实现特征选择降维降维是指在某些限定条件下,降低随机变量(特征)个数,得到一组“不相关”主变量的过程降低随机变量的个数相关特征(correlated feature):相对湿度与降雨量之间的相关等等正是因为在进行训练的时候,我们都是使用特征进行学习。如果特征本身存在问题或者特征之间相关性较强,对于算法学原创 2021-08-11 08:42:17 · 292 阅读 · 0 评论 -
【机器学习】快速入门机器学习
机器学习概述特征工程数据集特征工程介绍特征抽取特征预处理特征降维主成分分析总结分类算法回归与聚类算法原创 2021-08-07 17:00:20 · 378 阅读 · 0 评论 -
【机器学习】特征提取代码汇总
特征抽取import jiebafrom sklearn.datasets import load_irisfrom sklearn.feature_extraction import DictVectorizerfrom sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizerfrom sklearn.model_selection import train_test_splitdef datasets_原创 2021-08-07 16:44:05 · 1612 阅读 · 0 评论 -
Anaconda-- conda 创建、激活、退出、删除虚拟环境
conda 本地环境常用操作获取版本号conda --version 或 conda -V检查更新当前condaconda update conda查看当前存在哪些虚拟环境conda env list 或 conda info -e查看–安装–更新–删除包conda list:conda search package_name# 查询包conda install package_nameconda install package_name=1.5.0conda update p原创 2021-05-28 15:42:41 · 267 阅读 · 0 评论 -
Mac下通过Anaconda安装Tensorflow
Mac下通过Anaconda安装TensorflowAnaconda是一个基于python的科学计算平台,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本python并存、切换以及各种第三方包安装问题。这个平台里包含有python,scala,numpy等绝大部分主流的用于科学计算的包。1.安装Anaconda从官网下载(Mac版)最新版本的安装包有两种安装方式:通过图形化界面安装,下载的文件格式为.pkg通过命令行安装,下载的文件格式为转载 2021-05-17 16:31:37 · 1808 阅读 · 3 评论 -
【Python实现网络爬虫】Scrapy爬取网易新闻(仅供学习交流使用!)
1. 新建项目在命令行窗口下输入scrapy startproject scrapytest, 如下然后就自动创建了相应的文件,如下2. 修改itmes.py文件打开scrapy框架自动创建的items.py文件,如下# Define here the models for your scraped items## See documentation in:# https://docs.scrapy.org/en/latest/topics/items.htmlimport scra原创 2021-03-19 16:45:20 · 2617 阅读 · 7 评论 -
Anaconda安装jieba库
一、在官网中下载jieba库压缩包https://pypi.org/project/jieba/#files二、将压缩包解压到Anaconda安装文件夹的pkgs文件夹下三、安装打开Anconda prompt,进入到jieba相应的文件夹中输入命令行 python setup.py install 即可(本文中为D:\anaconda\new_launch\pkgs\jieba-0.42.1)四、验证进入pycharm中输入import jieba 没有报错注意事项:如果在原创 2021-02-25 21:46:57 · 5943 阅读 · 4 评论 -
Python 重复输出字符串
7.a =“1” b = a*2 输出b的值为A. 1B. 2C. 11D. null答案是C,因为python可以通过str * 2重复输出字符串print str * 2 # 输出字符串两次原创 2020-11-18 20:17:12 · 2810 阅读 · 0 评论 -
【Python】助力期末
本资料由 后端码匠 提供 更多精彩详请关注公众号1.编程输出斐波那契数列的前若干项。即根据用户输入的正整数,输出数列的各项,如输入正整数5,则输出斐波那契数列的前五项:1,1,2,3,5inputNum = int(input("你需要几项?"))# 第一和第二项n1 = 0n2 = 1count = 2# 判断输入的值是否合法if inputNum <= 0: print("请输入一个正整数。")elif inputNum == 1: print("斐波那契数原创 2020-11-17 23:02:06 · 2085 阅读 · 5 评论 -
【Python作业】定义动物类Animal,...编写猫类Cat...
代码class Animal(object): """定义动物类""" name = "" time = 0 def __init__(self, name, time): self.setName(name) self.setTime(time) def setName(self, name): self.name = name def setTime(self, time): if n原创 2020-11-13 14:50:37 · 17340 阅读 · 2 评论