- 博客(141)
- 资源 (1)
- 收藏
- 关注
原创 knn算法
import numpy as npfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifierdef knn_sklearn():#加载iris数据li = load...
2019-03-30 09:50:04 122 1
原创 ubuntu当中安装python
1.whoami是操作系统中用于查看当前有效用户名的命令2.wget https://www.python.org/ftp/python/3.6.8/Python-3.6.8.tgz3. cd /4. sudo mv Python-3.6.8.tgz ~5. cd ~6.ls7.tar -xvf Python-3.6.8.tgz8.cd Python-3.6.8/9…/config...
2019-03-29 19:18:56 76
原创 查看终端中输入的所有命令的历史记录
vd .bash_history 注释:查看所有在ubuntu终端输入的命令history是最近的输入命令的历史记录
2019-03-29 17:05:37 12601 4
原创 tknn算法,两个坐标点和一个坐标点直接求距离用numpy进行求
#[3,1],[3,2] 类别1#[1,3],[1,4] 类别2#[5,2]#把距离[5,2]距离最近的前两个点的类别找出import numpy as np注释:c1是属于类别1的c1 = np.array([3,1],[3,2])注释:c2是属于类别2的c2 = np.array([1,3],[1,4])注释:判断t分别到类别1中的距离和到类别2中的距离t = np.a...
2019-03-29 13:59:20 586
原创 有一个长度为n的数组a,里面的元素都是整数,现在一个整数b,写程序判断数组a中是否有两个元素的和等于b
def func(arr,d):l = []注释:枚举for index,i in enumerate(arr):注释:遍历索引for j in range(index+1):if i + arr[j] == d:if i != arr[j]:l.append((i,arr(j)))return l
2019-03-29 09:10:21 5804
原创 手机抓包工具
链接:https://pan.baidu.com/s/1CdEgm28fpmq91OhbO5m9Sg提取码:3x3s复制这段内容后打开百度网盘手机App,操作更方便哦https://www.jianshu.com/p/724097741bdf使用fiddler实现手机抓包...
2019-03-28 14:01:41 400
原创 先把字典向量化,然后再预测
import pandas as pdfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.feature_extraction import DictVectorizerdef decide_play():df = pd.read_csv(‘dtree.csv’)dict_train = df.loc[:,[‘Outlo...
2019-03-28 11:49:20 305
原创 字典的抽取,字典向量化
def dictvec():‘’’字典数据抽取:return:‘’’#实例化#字典的向量化#有多少种状态,用多少位的二进制表示,1表示该标签出现,0表示没有出现dict_vector = DictVectorizer(sparse=False)data = dict_vector.fit_transform([{‘city’:‘北京’,‘pos’:‘北方’,‘temp’:100...
2019-03-28 10:04:54 731
原创 决策树实现的基本原理
import numpy as npimport pandas as pddf = pd.read_csv(‘dtree.csv’)#刮风的6,3个出去玩,不刮风8,6个出去玩play_windy_y = 3/6play_windy_n = 3/6#a是熵刮风的熵a = (play_windy_nnp.log2(play_windy_n) + play_windy_ynp.log2...
2019-03-27 19:42:22 672
原创 pandas当中的unique的作用
dtree.csv文件Outlook,Temperatur,Humidity,Windy,Playsunny,85,85,FALSE,nosunny,80,90,TRUE,noovercast,83,86,FALSE,yesrainy,70,96,FALSE,yesrainy,68,80,FALSE,yesrainy,65,70,TRUE,noovercast,64,65,TRUE...
2019-03-27 19:14:39 1092
原创 决策树
def get_max_entropy(file_name,decide_name):df = pd.read_csv(file_name)df2 = df.loc[:,[‘Outlook’,‘Windy’]]# print(df2)c_play = df[decide_name] #选出列头为Play的一列c_play_group = c_play.value_counts() #打印...
2019-03-27 19:08:11 90
原创 二分法查找
def binary_search(list,data):n = len(list)first = 0last = n-1while first <= last:mid = int((first + last)/2)if list[mid] < data:first = mid + 1elif list[mid] > datalast = mid - 1els...
2019-03-27 17:26:29 84
原创 找到两个字符串重合的部分
def getLCString(str1, str2):#如果len(str1)和len(str2)取最短的maxlen = len(str1) if len(str1) < len(str2) else len(str2)print(maxlen)example = str1 if len(str1) < len(str2) else str2print(example)...
2019-03-26 20:35:10 3174
原创 英文纠错
class Spell(object):‘’’拼写纠错‘’’def __init__(self,file_name): content = open(file_name).read() self.words = re.findall('[A-Za-z]+',content) #英语分词 self.alphabet = "abcdefghijklmnopqrstuvw...
2019-03-26 17:07:00 732
原创 字典统计个数,以及给统计个数进行排序
content = open(‘big.txt’).read()cut_result = re.findall(r’[a-z]+’,content)d = {}for i in cut_result:key_word = i.lower()if key_word in d:d[key_word] += 1else:d[key_word] = 1print(d)注释:第二种防止取...
2019-03-26 11:44:38 2381
原创 字典统计单词的个数
content = open(‘big.txt’).read()print(content)cut_result = re.findall(r’[a-z]+’,content,re.I)d = {}注释:遍历所有的单词for i in cut_result:print(i)注释:如果在键里面个数就加一if i in d.keys():d[i] += 1else:d[i] = ...
2019-03-26 09:44:51 382
原创 列表和字典的操作
字典(Dictionary) (items)items()函数以列表返回可遍历的(键值)对元组数组.items()语法d={'a':24,'g':52,'i':12,'k':33}d.items()# 结果是:[('a', 24), ('g', 52), ('i', 12), ('k', 33)]# 按照值对d进行排序d1=sorted(d.items(),key=lambda...
2019-03-25 14:01:28 290
原创 使用正则将‘get_to_next_page'转换为‘getToNextPage’
result = re.findall(’[a-z]+’,‘get_to_next_page’)first_upper = list(map(lambda x:x.capitalize(),result[1:]))result[0] + ‘’.join(first_upper)[i.capitalize() for i in result[1:]] 注释:枚举‘getToNextPage’...
2019-03-25 10:37:09 173
原创 正则表达式re.sub中的
re.sub是个正则表达式方面的函数,用来实现通过正则表达式,实现比普通字符串的replace更加强大的替换功能。简单的替换功能可以使用replace()实现。def main():text = ‘123, word!’text1 = text.replace(‘123’, ‘Hello’)print(text1)if name == ‘main’:main()Hello, wold...
2019-03-25 10:17:13 421
原创 什么是ajax跨域,如何解决
http://192.168.1.100:8000http://192.168.1.100:8001在搜狐的网页不能请求新浪,如何解决:客户端解决,使用jsonp格式服务器端解决这个:
2019-03-25 09:52:56 128
原创 __setitem__
class A:def init(self):self[‘B’]=‘BB’self[‘D’]=‘DD’def __setitem__(self,name,value): print "__setitem__:Set %s Value %s" %(name,value)if name==‘main’:X=A()setitem(self,key,value):该方法应该按一定...
2019-03-22 14:51:26 557
原创 __getitem__
class DataTest:def init(self,id,address):self.id=idself.address=addressself.d={self.id:1,self.address:“192.168.1.1”}def __getitem__(self,key): return "hello"data=DataTest(1,“192.168.2.11”...
2019-03-22 14:48:47 1343
原创 原声版的朴素贝叶斯公式
all_doc = [‘Chinese Beijing Chinese’,‘Chinese Chinese Shanghai’,‘Chinese Macao’,‘Tokyo Japan Chinese’]all_target = [1,1,1,0]class SimpleNB(object):‘’’简单的贝叶斯分类器‘’’def init(self):‘’’在初始化的时候定义模...
2019-03-22 08:05:38 87
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人