现有两组样本数据,假如它们分别基于两套不同的方法,或者测于不同的设备,又或是出自两个人之手,如何证明它们有或没有显著性差别呢?当然可以拿个Excel表把数据画个图,然后找一堆人来投票,看觉得差不多还是觉得差得多的人哪方票数高。但终归这种做法有些主观,不够说明力。概率统计给出了一种更为客观的基于统计的方法,这里是一个Python的实现:
#!/usr/bin/python
# Paired difference hypothesis testing - Student's t-test
# Author: Jin Zhuojun
# History: Create Tue May 8 16:12:21 CST 2012
import string
import math
import sys
from scipy.stats import t
import matplotlib.pyplot as plt
import numpy as np
##############
# Parameters #
##############
ver = 1
verbose = 0
alpha = 0.05
def usage():
print """
usage: ./program data_file(one sample in one line)
"""
def main():
##########
# Sample #
##########
if