机器学习笔记(1)环境配置

Python环境配置

1.Anaconda安装:

由于官网下载较慢,推荐使用清华镜像源: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/.
我在下载的是Anaconda3-5.1.0-Windows-x86_64.exe,对应python3.6.5

(问题)安装vscode时,无法连接,解决办法:
在anaconda/pkgs下,找到vscode_inst.py文档,
第110行原为:VSCODE_ENDPOINT=‘https://vscodeupdate.azurewebsites.net/api/update/{}/stable/version’.format(VSCODE_SUBDIR) # NOQA
修改为:
VSCODE_ENDPOINT=‘https://update.code.visualstudio.com/api/update/{}/stable/version’.format(VSCODE_SUBDIR) # NOQA

2.visual studio安装

(1)登录vs官网https://visualstudio.microsoft.com/zhhans/?rr=https://www.microsoft.com/zh-cn/
(2)下载社区版
(3)选择

在这里插入图片描述

3.pycharm安装

(1)官网下载社区版 https://www.jetbrains.com/pycharm/download/#section=windows.
(2)配置python
添加anaconda路径下的python文件
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

4.第三方包的安装

以安装tensorflow为例,分享两种方法,都挺好用的:
1.anaconda prompt下利用pip指令安装
(1)进入anaconda prompt并输入activate激活环境
(2)输入`

pip install tensorflow==1.15.0 -i https://pypi.tuna.tsinghua.edu.cn/simple`

这里pip install X==XX -i XXX,X指第三包的名字,XX指第三包的版本,XX指换国内源。
2.pycharm安装第三方包
(1)打开pycharm setting的python interpreter,并取消使用conda package manager
在这里插入图片描述
点击右侧的加号,搜索你需要安装的包,并选择版本安装
在这里插入图片描述

第一个机器学习程序

K-NN算法
参考链接(https://blog.csdn.net/zx1245773445/article/details/83758493?utm_medium=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.edu_weight&depth_1-utm_source=distribute.pc_relevant_t0.none-task-blog-BlogCommendFromMachineLearnPai2-1.edu_weight)

import numpy as np
import operator
import matplotlib.pyplot as plt


##给出训练数据以及对应的类别
def create_dataset():
    group = np.array([[1.0, 2.0], [1.2, 0.1],
                      [0.1, 1.4], [0.3, 3.5]])
    labels = ['A', 'A', 'B', 'B']
    return group, labels


##通过KNN进行分类
def classify(input, dataSet, label, k):
    dataSize = dataSet.shape[0]
    ## 重复input为dataSet的大小
    diff = np.tile(input, (dataSize, 1)) - dataSet
    sqdiff = diff ** 2
    ## 列向量分别相加,得到一列新的向量,diff**2各元素的平方
    squareDist = np.array([sum(x) for x in sqdiff])
    dist = squareDist ** 0.5

    ## 对距离进行排序
    ## argsort()根据元素的值从小到大对元素进行排序,返回下标
    sortedDistIndex = np.argsort(dist)

    classCount = {}
    for i in range(k):
        ## 因为已经对距离进行排序,所以直接循环sortedDistIndx
        voteLabel = label[sortedDistIndex[i]]
        ## 对选取的k个样本所属的类别个数进行统计
        ## 如果获取的标签不在classCount中,返回0
        classCount[voteLabel] = classCount.get(voteLabel, 0) + 1
    ## 选取出现的类别次数最多的类别
    maxCount = 0
    for key, value in classCount.items():
        if value > maxCount:
            maxCount = value
            classes = key

    return classes


def draw_pic(input):
    plt.scatter([1.0, 1.2], [2.0, 0.1], label='A')
    plt.scatter([0.1, 0.3], [1.4, 3.5], label='B')
    plt.scatter(input[0], input[1], label='test')
    plt.legend()
    plt.show()


data, labels = create_dataset()
input = [0.5, 3.0]
draw_pic(input)
print(classify(input, data, labels, 2))

运行效果

在这里插入图片描述

  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值