![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Feature Engineering
特征工程
Up_梅子酒
这个作者很懒,什么都没留下…
展开
-
特征工程4
import tqdm import pandas as pd import numpy as np import pprint df = pd.DataFrame(np.arange(10).reshape(2,5)) pprint.pprint(df) 0 1 2 3 4 0 0 1 2 3 4 1 5 6 7 8 9 from sklearn.feature_extraction.text import TfidfVectorizer from nltk.s原创 2021-02-25 17:20:54 · 134 阅读 · 0 评论 -
特征工程3
第四章:特征构建:生成新的特征 import pandas as pd from sklearn.base import TransformerMixin import pandas as pd import numpy as np from matplotlib import pyplot as plt X = pd.DataFrame({'city':['tokyo', None, 'london', 'seattle', 'san francisco', 'to原创 2021-02-24 23:13:56 · 106 阅读 · 0 评论 -
set_index与 reset_index
tips= sns.load_dataset("tips") tips.shape data = tips.iloc[[2,22,222,10,30,50,70,80,201,140]] print(data) total_bill tip sex smoker day time size 2 21.01 3.50 Male No...原创 2021-01-19 11:44:41 · 104 阅读 · 0 评论 -
Chapter2
特征理解 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline plt.style.use('fivethirtyeight') salary_ranges = pd.read_csv('Salary_Ranges_by_...原创 2019-08-05 11:53:24 · 582 阅读 · 0 评论 -
【电子书奖励计划】特征工程
第一章主要是对于特征工程的介绍,阐述了特征工程的重要性。在机器学习工程师和数据科学家日常工作中,超过50%的时间事实上都是在数据的准备阶段。这其中包括存储,清洗,组织数据等等。特征工程就是这样的一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的学习性能。一个完整的特征工程包括对于数据中特征的理解,特征增强:清洗数据,特征选择,特征构建,特征转换,特征学习。最后本章还介绍了特征工程...原创 2019-08-26 10:09:55 · 991 阅读 · 0 评论 -
data cleansing and normalizing
Data Cleansing Cleaning Rows with NaNs import pandas as pd df = pd.read_csv('NaNDataset.csv') df.isnull().sum() A 0 B 2 C 0 dtype: int64 print(df) A B C 0 1 2.0 3 1 4 ...原创 2019-09-02 20:39:18 · 212 阅读 · 0 评论 -
特征工程2
第三章 特征增强:清洗数据 import os os.listdir() ['.config', 'sample_data'] !git clone https://github.com/********/Feature-Engineering-Made-Easy.git Cloning into 'Feature-Engineering-Made-Easy'... remote: Enumerating objects: 63, done.[K remote: Total 63 (delta 0原创 2020-07-29 23:38:57 · 341 阅读 · 0 评论 -
特征工程1
第二章 数据等级总结 import os os.listdir() ['.config', 'sample_data'] !git clone https://github.com/Childish1jin/Feature-Engineering-Made-Easy.git Cloning into 'Feature-Engineering-Made-Easy'... remote: Enumerating objects: 63, done.[K remote: Total 63 (delta原创 2020-07-28 23:10:16 · 430 阅读 · 0 评论