- 博客(4)
- 资源 (1)
- 收藏
- 关注
原创 数据挖掘学习-Apriori算法
# data from http://grouplens.org/datasets/movielens/ # import os # data_folder = os.path.join(os.path.expanduser("~"), "Data", "ml-100k") # ratings_filename = os.path.join(data_folder, "u.data") fro...
2019-08-30 14:11:32 909
原创 Altair的使用学习
Altair的使用学习 # !pip install vega # !pip install vega_datasets import altair as alt alt.renderers.enable('notebook') RendererRegistry.enable('notebook') # load a simple dataset as a pandas DataFrame ...
2019-08-27 13:57:02 2112 1
原创 【电子书奖励计划】特征工程
第一章主要是对于特征工程的介绍,阐述了特征工程的重要性。在机器学习工程师和数据科学家日常工作中,超过50%的时间事实上都是在数据的准备阶段。这其中包括存储,清洗,组织数据等等。特征工程就是这样的一个过程:将数据转换为能更好地表示潜在问题的特征,从而提高机器学习的学习性能。一个完整的特征工程包括对于数据中特征的理解,特征增强:清洗数据,特征选择,特征构建,特征转换,特征学习。最后本章还介绍了特征工程...
2019-08-26 10:09:55 996
原创 Chapter2
特征理解 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline plt.style.use('fivethirtyeight') salary_ranges = pd.read_csv('Salary_Ranges_by_...
2019-08-05 11:53:24 603
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人