自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (16)
  • 收藏
  • 关注

原创 Python 函数字典系列1-通用的灵活函数

简介怎样更好的去组织Python的函数,使之具有更好的耦合性和健壮性,以便进行更好的分工和协作是一个比较大的话题。这部分的内容可能会比较庞杂,而且每个人的风格和习惯会不相同,所以后续的内容:仅为一家言,看客不必过于纠结其优雅性是面向实战应用出发的,大家看了觉得有点用就好千头万绪不知从何说起,所以内容没有大纲,我会按功能点的方式逐个覆盖,并试图在最后连起来思路通过设定一些通用的简单...

2020-03-28 22:57:37 255

原创 Python实现决策树(系列文章5)--矩阵并行计算

对于表格计算来说,所有用for循环写的计算都可以用矩阵(点乘)来进行并行计算。1 为什么需要用矩阵改进这部分内容本来应该在介绍基本函数之后介绍的,不过正好在构建梯度树的时候发现速度实在太慢了,就需要提前进行修改了,顺带也说下。一般来说,在算法的初始版本,用for循环是很自然的书写方式,容易理解。不过for循环有个大问题-- 执行是按照顺序逐个循环的。例如,目前数据集有10个候选变量可供选择...

2020-03-10 12:04:28 897

转载 关于Jinja写的不错的一篇文章(转载)

打开页面特效一:渲染模版要渲染一个模板,通过render_template方法即可。@app.route('/about/') def about(): # return render_template('about.html',user='username') return render_template('about.html',**{'user':'usernam...

2020-03-09 09:14:21 198

原创 Python实现决策树(系列文章4)--我的决策树

纸上得来终觉浅,绝知此事要coding !1 关于算法的一些简单想法什么是算法? — 算法就是非显示的编程【大约是我看过最简明扼要的版本】我觉得算法可以通俗的理解为炒菜,我们知道从何处开始(食材、调料),我们也可以大约的知道何时结束(你尝尝味道差不多就行了)。但是中间的过程我们有大致的方法(但是不知道具体应该是多少),例如我们知道放点盐才会有咸味,但是是多少呢?“少许盐”要怎么少许呢?这个...

2020-03-07 14:32:44 645

原创 Python实现决策树(系列文章3)-- 从数据分析到决策树

决策树最大的优点是它的过程完全符合人的思考习惯:分门别类,逐步深入。1 决策树的历史2 决策树的原理3 泰坦尼克号数据分析4 开始决策树

2020-03-06 17:39:34 1213 1

原创 Python实现决策树(系列文章2)-- 数据的预处理

本篇介绍了K对于决策树算法的理解以及数据处理。(这个老爷爷是出来撑场子的)

2020-03-05 15:34:59 4570 1

原创 Python实现决策树(系列文章1)--从最简单的算法开始

1 初衷2 文章的内容3 从泰坦尼克号开始(Kaggle)Introduction to Decision Trees (Titanic dataset)

2020-03-05 09:17:06 387

原创 Python 的深拷贝和浅拷贝

在算法中,有的时候需要使用到一个通用的模板(字典)。如果没有使用深拷贝的化子元素会变。深拷贝: import copya = copy.deepcopy(b)import copyD1 = {‘user’: ‘runoob’, ‘num’: [1, 2, 3]} # 原始数据D2 = D1 # 直接引用:D2和D1整体指向同一对象。D3 = D1.copy() # 浅拷贝:D3和...

2020-03-03 16:57:04 125

sh000016.csv

沪深300的日线数据

2021-12-21

customer_segmentation.zip

使用sklearn kmeans客户分群

2021-05-04

credit_scoring.zip

使用german credit数据做的多模型选择例子

2021-05-04

churn_sample.zip

用python实现knime的churn prediction

2021-05-03

正则表达式.ipynb

简单梳理了一下python正则表达式的几个函数

2021-01-13

python语言基础

python基本的语法、规范,数据对象等。适合0基础想学python的人。 内容只有一个jupyter,极度精简,1个小时应该能看完。

2021-01-11

1 python的三种类方法

Python对象里有三类方法: 1 类方法 @classmethod :基于类的一些属性进行调用,第一个参数是cls 2 静态方法 @staticmethod: 本质上和普通函数没什么不同,归集到一个类下面,相当于整理 3 实例方法 :需要结合对象的实例使用,第一个参数是cls

2021-01-10

DataManipulation-0.1.12.1-py3-none-any.whl

数据处理的基本函数包。主要基于Pandas,Numpy。 import pandas as pd import numpy as np import pickle import datetime import os import hashlib import pika import json import time

2020-07-11

DataManipulation-0.1.7-py3-none-any.whl

包含了一些数据操作用的函数,当前版本0.1.6。用于建模的数据清洗、重采样 、离散化、计算信息值等操作。拷贝后使用pip3 install + 路径/文件名即可。依赖的包目前为numpy,pandas和pickle,都是常用基础包

2020-05-30

netflix_titles.csv

TV Shows and Movies listed on Netflix This dataset consists of tv shows and movies available on Netflix as of 2019. The dataset is collected from Flixable which is a third-party Netflix search engine. In 2018, they released an interesting report which shows that the number of TV shows on Netflix has nearly tripled since 2010. The streaming service’s number of movies has decreased by more than 2,000 titles since 2010, while its number of TV shows has nearly tripled. It will be interesting to explore what all other insights can be obtained from the same dataset. Integrating this dataset with other external datasets such as IMDB ratings, rotten tomatoes can also provide many interesting findings. Inspiration Some of the interesting questions (tasks) which can be performed on this dataset - Understanding what content is available in different countries Identifying similar content by matching text-based features Network analysis of Actors / Directors and find interesting insights Is Netflix has increasingly focusing on TV rather than movies in recent years.

2020-05-29

DataManipulation-0.1.6-py3-none-any.whl

包含了一些数据操作用的函数,当前版本0.1.6。用于建模的数据清洗、重采样 、离散化、计算信息值等操作。拷贝后使用pip3 install + 路径/文件名即可。依赖的包目前为numpy,pandas和pickle,都是常用基础包

2020-05-24

raw_data.csv

10万条数据,用于dataframe的一般性测试数据。10万条数据,用于dataframe的一般性测试数据。

2020-05-09

sample_data4.csv

用于展示聚类寻找变量的样例数据集。用于展示聚类寻找变量的样例数据集。用于展示聚类寻找变量的样例数据集。用于展示聚类寻找变量的样例数据集。

2020-05-02

sample_data3.csv

大约10万条数据,有x和y两列,用于算法的样本测试。

2020-05-01

sample_data2.csv

用于连续边浪的属性切分。

2020-04-29

sample_data1.csv

测试数据集,用于测试决策树的

2020-04-27

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除