- 博客(6)
- 收藏
- 关注
原创 【数据挖掘】datafountain-信用卡建模逻辑回归
import numpy as npimport pandas as pdimport warningswarnings.filterwarnings('ignore')data=pd.read_csv('/Users/chouyangyu/Downloads/cs-training.csv')data.head(10)data=data.iloc[:,1:]data.columns= ['Label', 'RevolvingRatio', 'Age', '30-59D', 'DebtR
2020-10-14 23:43:41 820
原创 【数据挖掘】datafountain&&lending club缺失值和异常值
import numpy as npimport pandas as pdimport warningswarnings.filterwarnings('ignore')/Users/chouyangyu/Downloads/accepted_2007_to_2018Q4.csvdata = pd.read_csv('/Users/chouyangyu/Downloads/lc_2016_2017.csv') # 读取数据# data = data.sample(int(data.
2020-10-14 16:37:41 577
原创 【机器学习】numpy+pandas刷题
*8:*创建二维等差数组:np.arange(6).reshape(2, 3)9: 创建单位矩阵(二维数组):np.eye(3)21:矩阵乘法运算np.mat(A) * np.mat(B)52:使用数字 0 将一个全为 1 的 5x5 二维数组包围: Z = np.ones((5, 5))Z = np.pad(Z, pad_width=1, mode='constant', constant_values=0)Z59: 使用五种不同的方法去提取一个随机数组的整数部分:Z = np.ran
2020-10-11 14:26:10 1109
原创 [互联网]互联网公司的种类
。一、基础性服务类,包括四个方面1、新闻咨询服务:简单来说就是将新闻、咨询等信息放在某些咨询中,供大家来查看。具体有可以分成三类:综合性的咨询平台:例如“三大门户”、腾讯新闻、凤凰新闻等地方性综合咨询平台:例如南方网(广东)、湖南在线、星辰在线(长沙)等垂直行业咨询平台:例如专注互联网行业的虎嗅网、36kr。2、信息搜索类:变被动为主动,就成了信息搜索类了,具体可以分为下面两类。综合性搜索:例如百度、google、搜狗等。垂直精准搜索:例如专注学术方面的百度学术、知网,3、邮箱:邮箱也是早期用户的基
2020-10-10 12:05:57 6463
原创 【数据分析-数据挖掘】BI-data analytics-data science
*数据分析**是一个相当广的领域,其中包含了数据科学。数据科学是最近比较火的一个名词,与传统的数据分析相比都是从数据中找到知识和见解,只是在使用的技能和方式下有一定差异。并不是所有的数据分析都是商业的,所以他们两有一个定的交集。有的数据科学过程并不直接是商业分析,但却是数据分析。比如在石油行业中“钻井作业优化”需要数据科学工具和技术,属于数据科学家的日常工作。但是,我们不能将其和商业分析关联起来。数据分析师 vs 数据科学家1. 虽然数据分析师和数据科学家都与数据打交道,但主要的区别在于他...
2020-10-09 23:16:18 642
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人