航空公司客户价值分析

1 目的 对历史客户数据进行分析,区分客户的类型,以便对客户提供更适合的服务。 2 数据探索 查看数据整体情况 import pandas as pd path = r'C:\Users\Liang\Desktop\Python_shujufenxiyuwajueshizhan\chapter7...

2019-08-10 15:43:44

阅读数 4

评论数 0

k-Means算法实现

import numpy as np # 计算欧式距离 def euclDistance(vector1, vector2): return np.sqrt(sum((vector2 - vector1) ** 2)) # 初始化质心 def initCentroids(dataSe...

2019-08-05 17:43:11

阅读数 8

评论数 2

决策树算法实现(ID3分类树)

此处为ID3决策树,C4.5和cart决策树只要把对比的量更改即可 import numpy as np import pandas as pd from pandas import DataFrame, Series data = {'no surfacing': [1, 1, 1, 0, 0...

2019-07-30 09:47:16

阅读数 3

评论数 0

泰坦尼克号生存预测 数据分析+挖掘建模

数据集来源:Kaggle https://www.kaggle.com/vikichocolate/titanic-machine-learning-from-disaster 数据集各字段的含义 PassengerId 乘客编号 Survived 是否幸存 Pclass 船票等级 Name 乘客...

2019-07-27 12:16:50

阅读数 12

评论数 0

特征工程_note

首先明确概念:用来训练模型的数据集越大,数据质量越好,数据模型的复杂度就越低 如果特征来自于不同的文件、数据库表、csv等,就要把不同地方的数据进行规整,统一存储在一个方便以后使用的地方 数据清洗 数据样本抽样 异常值、空值处理 数据样本抽样要注意: 抽样要具有代表性:样本各个特征的比例要尽量与整...

2019-07-23 10:47:24

阅读数 5

评论数 0

狭义数据分析3

交叉分析 分析属性和属性间的关系,交叉分析的方法比较多,如可以任意取两列,用假设检验的方法,判断他们之间是否有联系,也可以直接以一个或几个属性为行,一个或几个属性为列,做成一张透视表,通过观察这张新生成的表的性质,可以更直观的分析两个属性或几个属性之间的关系 import numpy as np ...

2019-07-22 00:19:41

阅读数 3

评论数 0

狭义数据分析2

多因子分析与复合分析 探索属性和属性之间的联系,分析属性和属性之间联系的分析方法 假设检验 根据一定的假设条件,从样本推断总体,或者推断样本与样本之间关系。作出一个假设,然后根据数据,或者根据已知的分布性质来推断这个假设成立的概率有多大 方法: 建立原假设H0,H0的反命题H1(备择假设)在假设...

2019-07-22 00:11:28

阅读数 7

评论数 0

狭义数据分析1

抽样理论 集中趋势:均值、中位数、分位数、众数 离中趋势:标准差、方差 数据分布:偏态、峰态、正态分布 抽样理论:抽样误差、抽样精度 均值 df.mean() 计算:数字加起来除以总量 作用:经常用来衡量一些连续值,尤其是分布比较规律、均匀的连续值的集中趋势。 中位数 df.median(...

2019-07-21 23:59:00

阅读数 2

评论数 0

Django结合Ajax的三个demo

利用Ajax技术实现页面的局部刷新,降低服务器的压力。 Ajax是爬虫、前端、后台不分家的地方。之前遇到过蛮多的,所以自己实现一下。做了一段时间的东西了,此处做一下汇总。 此处两个demo: xhr翻页 实现购物车功能(Ajax配合session) 搜索提示 1.xhr翻页 动态从后台数据库读...

2019-05-31 20:07:08

阅读数 15

评论数 0

破解滑块验证码(打码平台)

此处以模拟登录B站为例,链接 >>> https://passport.bilibili.com/login 打码平台用的是 联众打码 >>> https://www.jsdati.com/ 滑块验证码样式如下 ...

2019-05-26 12:50:26

阅读数 856

评论数 0

如何用python优雅的实现二维列表平铺

实现二维列表的平铺有两种方法 逐一遍历列表中的元素,并添加到一个新列表当中 对每一行进行拼接,列表之间相加 逐一遍历列表中的元素,并添加到一个新列表当中 先来看最C的方法 >>>alist = [[1,2,3],[4,5,6],[7,8,9]] &am...

2019-05-10 22:03:02

阅读数 45

评论数 0

爬取实习僧并进行数据可视化

网页传送门 实习僧有字体反爬,但是是静态的字体文件,所以难度不大。 解决实习增的字体反爬的思路:先把网页中字体文件的base64编码匹配下来,进行base64解码,下载下来,用字体可视化工具将所有字体按顺序写在一个列表里面记录下来,用TTFont方法处理这个文件得到的font对象,你会发现fon...

2019-05-01 14:31:46

阅读数 108

评论数 7

Python装饰器的使用

Python当中所有东西都是对象,函数也不例外。所以要实现,在不改变一个函数的代码的情况下,给一个函数增加功能,可以在另一个函数里面调用这个函数,并执行别的功能。 def decorator(func): def wrapper(): string = 'test'*2 ...

2019-04-26 20:54:49

阅读数 20

评论数 0

Django第一个项目总结

第一个项目总结 本项目是编写一个基于django的系统,实现分布式爬虫的对接以及爬取数据的可视化。 Django配置 数据库使用磁盘数据库sqlite DATABASES = { 'default': { 'ENGINE': 'django.db.backends.sqli...

2019-04-20 20:34:10

阅读数 65

评论数 0

计算天数(Python实现)

L1-15 计算天数 (15 分) 本题要求编写程序计算某年某月某日是该年中的第几天。 输入格式: 输入在一行中按照格式“yyyy/mm/dd”(即“年/月/日”)给出日期。注意:闰年的判别条件是该年年份能被4整除但不能被100整除、或者能被400整除。闰年的2月有29天。 输出格式: 在一行输出...

2019-03-16 22:24:39

阅读数 145

评论数 0

古风排版(python实现)(解包转置矩阵)(*号语法和zip的巧用)

L1-039 古风排版 (20 分) 中国的古人写文字,是从右向左竖向排版的。本题就请你编写程序,把一段文字按古风排版。 输入格式: 输入在第一行给出一个正整数N(<100),是每一列的字符数。第二行给出一个长度不超过1000的非空字符串,以回车结束。 输出格式: 按古风格式...

2019-03-16 21:26:11

阅读数 25

评论数 1

输出GPLT(猴子选大王变型)(Python实现)

输出GPLT (20 分) 给定一个长度不超过10000的、仅由英文字母构成的字符串。请将字符重新调整顺序,按GPLTGPLT…这样的顺序输出,并忽略其它字符。当然,四种字符(不区分大小写)的个数不一定是一样多的,若某种字符已经输出完,则余下的字符仍按GPLT的顺序打印,直到所有字符都被输出。 输...

2019-03-16 21:09:03

阅读数 167

评论数 0

Django实战篇1(搜索,排序,页面逻辑)

原始数据从当当网爬取到MongoDB里,导出为json文件,由于开始没爬图片,此处补上,没有使用数据库~ 准备部分: import pickle import requests import os import time class PhotoDownloader(object): def ...

2019-03-15 23:11:55

阅读数 43

评论数 0

你还不使用 += 吗?

python里面有普通的+,有operator里面的add方法表示加,还有a += 1,a = a + 1的形式,那么他们有什么区别呢???先看一组测试 #!/usr/bin/env python # -*- coding: utf-8 -*- import operator from cop...

2019-03-10 20:03:15

阅读数 19

评论数 0

pickle库的使用

pickle库可以直接存储数据结果和从pk文件中读取数据结构,相当于一个很强大的全局变量,特别是我在用框架之类的要读取记忆数组,但是因为框架会在程序之间频繁的跳动,所有全局变量会一直被初始化而不管用了,pickle库就可以解决这个问题 # 将数据结构写入文件 with open('D:/...

2019-03-09 10:22:13

阅读数 109

评论数 0

提示
确定要删除当前文章?
取消 删除