python
Ashen_ffm
这个作者很懒,什么都没留下…
展开
-
机器学习---特征预处理
意义 通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程,如下图1. 包含内容数值型数据的无量纲化归一化标准化2. APIsklearn.preprocessing3. 进行归一化/标准化的原因特征的单位或大小相差较大,或者某特征的方差相比其他的特征要大出几个数量级,容易影响(支配)目标结果,使得一些算法无法学习到其他的特征3.1 归一化定义:通过...原创 2020-03-04 13:06:38 · 471 阅读 · 0 评论 -
机器学习---文本特征抽取---TFIDF
背景:某个词或某个短语在某类文章中出现的频率高,并且在别类文章中频率不高,适合用于分类TF-IDF作用:用以评估一字词对于文件集或一个语料库中的其中一份文件的重要程度1. 公式1.1 词频(term frequency, tf) 指的是某一个给定的词语在该文件中出现的频率1.2 逆向文档频率(inverse document frequency, idf) 是一个词语普遍重要性的度量。某一...原创 2020-03-04 11:37:05 · 753 阅读 · 0 评论 -
爬虫学习(三)---基于bs4的信息提取
find_all()函数的使用# 返回一个列表类型,存储查找的结果find_all(name, attrs, recursive, string, **kwargs)soup.find_all() 也可以为 soup()参数意义name对标签名称检索的字符串, 例如:‘a’ , ‘p’ , …attrs对标签属性值的检索字符串,可标注属性检索recur...原创 2020-02-23 22:56:47 · 291 阅读 · 0 评论 -
爬虫学习(二)---bs4库的使用
文章目录1. bs4库的安装2. bs4的初始化1. bs4库的安装通过cmd安装 bs4pip install beautifulsoup42. bs4的初始化import requestsfrom bs4 import BeautifulSoupr = requests.get("http://www.baidu.com")soup = BeautifulSoup(r.tex...原创 2020-02-23 18:54:49 · 811 阅读 · 0 评论 -
爬虫学习(一)---requests库的使用
文章目录1. requests库的安装2. requests库的方法3. requests库抓取网站框架1. requests库的安装通过 cmd 安装 requests库 :pip install requests2. requests库的方法函数作用request()构造一个请求,支撑一下个方法的基础方法get()获取HTML网页的主要方法,对应于HT...原创 2020-02-23 13:45:03 · 181 阅读 · 0 评论 -
CCF 201903-2 二十四点 C++实现 + python eval函数 实现
两种代码实现方式:1.使用栈实现n = int(input())for i in range(n):expt = input()opStack, numsStack = [], []for c in expt: if c == '+' or c == '-' or c == 'x' or c == '/': opStack.append(c) eli...原创 2019-09-05 12:56:52 · 757 阅读 · 0 评论 -
机器学习---特征工程
sklearn: 特征工程特征抽取/特征提取机器学习算法 — 统计方法 — 数学公式文本类型 -> 数值字典特征提取图像特征提取(深度学习)特征预处理特征降维pandas;数据清洗;数据处理...原创 2019-11-27 17:03:43 · 124 阅读 · 1 评论 -
机器学习---字典特征提取---python + sklearn
from sklearn.feature_extraction import DictVectorizer"""字典特征提取: DictVectorizer(sparse = True,...) -> one-hot编码:每一个类别为列应用场景: 1)数据集中类别特征比较多 1. 将数据集中的特征 -> 字典类型 2. DictVecto...原创 2019-11-27 16:54:09 · 342 阅读 · 0 评论 -
洛谷P1090 合并果子 ---python---priorityqueue---贪心
题目描述在一个果园里,多多已经将所有的果子打了下来,而且按果子的不同种类分成了不同的堆。多多决定把所有的果子合成一堆。每一次合并,多多可以把两堆果子合并到一起,消耗的体力等于两堆果子的重量之和。可以看出,所有的果子经过 n-1n−1 次合并之后, 就只剩下一堆了。多多在合并果子时总共消耗的体力等于每次合并所耗体力之和。因为还要花大力气把这些果子搬回家,所以多多在合并果子时要尽可能地节省体力。...原创 2019-09-20 18:53:46 · 900 阅读 · 0 评论 -
机器学习---文本特征提取---python + sklearn
from sklearn.feature_extraction.text import CountVectorizerimport jieba"""单词 作为 特征句子、短语、单词、字母特征: 特征词方法1:CountVectorizer(stop_words[]) # stop_words[] 停用词表 不需要统计的特征词放进列表里"""def count_demo1():...原创 2019-11-27 16:57:16 · 427 阅读 · 0 评论