2019年03月_weixin_44274975

原创 knn算法

import numpy as npfrom sklearn.datasets import load_irisfrom sklearn.model_selection import train_test_splitfrom sklearn.neighbors import KNeighborsClassifierdef knn_sklearn():#加载iris数据li = load...

2019-03-30 09:50:04 122 1

原创 ubuntu当中安装python

1.whoami是操作系统中用于查看当前有效用户名的命令2.wget https://www.python.org/ftp/python/3.6.8/Python-3.6.8.tgz3. cd /4. sudo mv Python-3.6.8.tgz ~5. cd ~6.ls7.tar -xvf Python-3.6.8.tgz8.cd Python-3.6.8/9…/config...

2019-03-29 19:18:56 76

原创查看终端中输入的所有命令的历史记录

vd .bash_history 注释：查看所有在ubuntu终端输入的命令history是最近的输入命令的历史记录

2019-03-29 17:05:37 12601 4

原创 python官方的中文文档地址

https://docs.python.org/zh-cn/3/

2019-03-29 14:30:09 1353

原创 tknn算法，两个坐标点和一个坐标点直接求距离用numpy进行求

#[3,1],[3,2] 类别1#[1,3],[1,4] 类别2#[5,2]#把距离[5,2]距离最近的前两个点的类别找出import numpy as np注释：c1是属于类别1的c1 = np.array([3,1],[3,2])注释：c2是属于类别2的c2 = np.array([1,3],[1,4])注释：判断t分别到类别1中的距离和到类别2中的距离t = np.a...

2019-03-29 13:59:20 586

原创白话文机器学习

http://10.8.13.14:8000/白话大数据与机器学习_章节目录.pdf

2019-03-29 11:29:06 241

原创数据分析方面的资料

1.https://blog.csdn.net/mingyunxiaohai/

2019-03-29 11:24:26 154

原创人脸识别

facerecognition，这个包

2019-03-29 09:38:51 70

原创有一个长度为n的数组a,里面的元素都是整数，现在一个整数b，写程序判断数组a中是否有两个元素的和等于b

def func(arr,d):l = []注释：枚举for index,i in enumerate(arr):注释：遍历索引for j in range(index+1):if i + arr[j] == d:if i != arr[j]:l.append((i,arr(j)))return l

2019-03-29 09:10:21 5804

原创给很多测试数据，找出那个环节对造成结果的影响比较大

2019-03-28 20:23:05 156

原创 PCA

主成分分析

2019-03-28 15:20:31 208

原创手机抓包工具

链接：https://pan.baidu.com/s/1CdEgm28fpmq91OhbO5m9Sg提取码：3x3s复制这段内容后打开百度网盘手机App，操作更方便哦https://www.jianshu.com/p/724097741bdf使用fiddler实现手机抓包...

2019-03-28 14:01:41 400

原创先把字典向量化，然后再预测

import pandas as pdfrom sklearn.tree import DecisionTreeClassifierfrom sklearn.feature_extraction import DictVectorizerdef decide_play():df = pd.read_csv(‘dtree.csv’)dict_train = df.loc[:,[‘Outlo...

2019-03-28 11:49:20 305

原创 tfidf

有词的有数字

2019-03-28 10:21:46 599

原创字典的抽取，字典向量化

def dictvec():‘’’字典数据抽取:return:‘’’#实例化#字典的向量化#有多少种状态,用多少位的二进制表示,1表示该标签出现,0表示没有出现dict_vector = DictVectorizer(sparse=False)data = dict_vector.fit_transform([{‘city’:‘北京’,‘pos’:‘北方’,‘temp’:100...

2019-03-28 10:04:54 731

原创决策树实现的基本原理

import numpy as npimport pandas as pddf = pd.read_csv(‘dtree.csv’)#刮风的6,3个出去玩,不刮风8,6个出去玩play_windy_y = 3/6play_windy_n = 3/6#a是熵刮风的熵a = (play_windy_nnp.log2(play_windy_n) + play_windy_ynp.log2...

2019-03-27 19:42:22 672

原创 pandas当中的unique的作用

dtree.csv文件Outlook,Temperatur,Humidity,Windy,Playsunny,85,85,FALSE,nosunny,80,90,TRUE,noovercast,83,86,FALSE,yesrainy,70,96,FALSE,yesrainy,68,80,FALSE,yesrainy,65,70,TRUE,noovercast,64,65,TRUE...

2019-03-27 19:14:39 1092

原创决策树

def get_max_entropy(file_name,decide_name):df = pd.read_csv(file_name)df2 = df.loc[:,[‘Outlook’,‘Windy’]]# print(df2)c_play = df[decide_name] #选出列头为Play的一列c_play_group = c_play.value_counts() #打印...

2019-03-27 19:08:11 90

原创二分法查找

def binary_search(list,data):n = len(list)first = 0last = n-1while first <= last:mid = int((first + last)/2)if list[mid] < data:first = mid + 1elif list[mid] > datalast = mid - 1els...

2019-03-27 17:26:29 84

原创算法面试题

https://savorld.gitlab.io/post/python-algorithm-problem/#4-杨氏矩阵查找

2019-03-27 14:05:08 100

原创找到两个字符串重合的部分

def getLCString(str1, str2):#如果len(str1)和len(str2)取最短的maxlen = len(str1) if len(str1) < len(str2) else len(str2)print(maxlen)example = str1 if len(str1) < len(str2) else str2print(example)...

2019-03-26 20:35:10 3174

原创 find语法

1.包含就返回开始的索引注释：b[0]的位置是2在a的索引是1

2019-03-26 20:20:46 182

原创各种数据

https://www.kesci.com/home/datase

2019-03-26 19:39:16 154

原创英文纠错

class Spell(object):‘’’拼写纠错‘’’def __init__(self,file_name): content = open(file_name).read() self.words = re.findall('[A-Za-z]+',content) #英语分词 self.alphabet = "abcdefghijklmnopqrstuvw...

2019-03-26 17:07:00 732

原创字典统计个数，以及给统计个数进行排序

content = open(‘big.txt’).read()cut_result = re.findall(r’[a-z]+’,content)d = {}for i in cut_result:key_word = i.lower()if key_word in d:d[key_word] += 1else:d[key_word] = 1print(d)注释：第二种防止取...

2019-03-26 11:44:38 2381

原创字典统计单词的个数

content = open(‘big.txt’).read()print(content)cut_result = re.findall(r’[a-z]+’,content,re.I)d = {}注释：遍历所有的单词for i in cut_result:print(i)注释：如果在键里面个数就加一if i in d.keys():d[i] += 1else:d[i] = ...

2019-03-26 09:44:51 382

原创列表和字典的操作

字典(Dictionary) (items)items()函数以列表返回可遍历的(键值)对元组数组.items()语法d={'a':24,'g':52,'i':12,'k':33}d.items()# 结果是:[('a', 24), ('g', 52), ('i', 12), ('k', 33)]# 按照值对d进行排序d1=sorted(d.items(),key=lambda...

2019-03-25 14:01:28 290

原创 requests访问为什么要带上header

就是骗取对方网站

2019-03-25 10:48:27 1189

原创爬虫工作中如何破解及校验验证码

http:www.geetest.com:很多的验证码都是对接到这个公司的，用selenmiu模拟

2019-03-25 10:47:18 663

原创使用正则将‘get_to_next_page'转换为‘getToNextPage’

result = re.findall(’[a-z]+’,‘get_to_next_page’)first_upper = list(map(lambda x:x.capitalize(),result[1:]))result[0] + ‘’.join(first_upper)[i.capitalize() for i in result[1:]] 注释：枚举‘getToNextPage’...

2019-03-25 10:37:09 173

原创正则表达式

https://blog.csdn.net/weixin_44285988/article/details/86178741

2019-03-25 10:32:24 45

原创正则表达式re.sub中的

re.sub是个正则表达式方面的函数，用来实现通过正则表达式，实现比普通字符串的replace更加强大的替换功能。简单的替换功能可以使用replace()实现。def main():text = ‘123, word!’text1 = text.replace(‘123’, ‘Hello’)print(text1)if name == ‘main’:main()Hello, wold...

2019-03-25 10:17:13 421

原创什么是ajax跨域，如何解决

http://192.168.1.100:8000http://192.168.1.100:8001在搜狐的网页不能请求新浪，如何解决：客户端解决，使用jsonp格式服务器端解决这个：

2019-03-25 09:52:56 128

原创阐明一个数据分析的基本流程

1.数据采集：python招聘职位的2.数据基础分析和清洗：这个就是把工资中怎么处理的3.数据可视化

2019-03-25 09:47:47 220

原创什么是函数式编程或者python中的匿名函数

函数式编程是用lambda函数，map

2019-03-25 09:30:04 108

原创怎么判断类型

2019-03-25 09:17:16 276

原创 setitem

class A:def init(self):self[‘B’]=‘BB’self[‘D’]=‘DD’def __setitem__(self,name,value): print "__setitem__:Set %s Value %s" %(name,value)if name==‘main’:X=A()setitem(self,key,value)：该方法应该按一定...

2019-03-22 14:51:26 557

原创 getitem

class DataTest:def init(self,id,address):self.id=idself.address=addressself.d={self.id:1,self.address:“192.168.1.1”}def __getitem__(self,key): return "hello"data=DataTest(1,“192.168.2.11”...

2019-03-22 14:48:47 1343

原创 newspapers

2019-03-22 09:35:20 172

原创原声版的朴素贝叶斯公式

all_doc = [‘Chinese Beijing Chinese’,‘Chinese Chinese Shanghai’,‘Chinese Macao’,‘Tokyo Japan Chinese’]all_target = [1,1,1,0]class SimpleNB(object):‘’’简单的贝叶斯分类器‘’’def init(self):‘’’在初始化的时候定义模...

2019-03-22 08:05:38 87

cookie(1).txt

空空如也