Data8 开荒记(环境配置与基本介绍)

00 前言

这是我配过的最久的一次环境,折腾了大概有五个小时吧,网上的资料比较零散,特此将我的经历记录如下,节省后来人的时间,帮助大家更快更好地入门。
这门课的后续是data100,学习data100时也需要搭建类似的环境,所以是一箭双雕呐。

01 大体介绍

官网:data-8.github.io

资料的开源链接:data-8
(可能会比较杂,搜索自己想要的年份即可,如fa22,或者直接修改下面这个链接)

克隆仓库(fa22):git clone git@github.com:data-8/materials-fa22.git

简单介绍:面向数据科学家的两门课:Data8 和 DS100 - 知乎
p.s:在csdiy中收录了data100这门课:UCB Data100: Principles and Techniques of Data Science - CS自学指南

资源情况:

资源情况
lab
reading
slides
video
homework
project
vitamin✅(fa20)
test部分有效

再补充几点说明

  • reading对应的代码在资料的lec文件夹里
  • 根据我现在的学习情况,lab基本有测试,homework有时候只测试输出格式,不检查正确性。
  • lab是开源的,但官网上的lab是配好的在线环境,我们是没有访问权限,无法访问的。因此需要自行配置环境,也就是下文的内容

02 搭建环境

1. 安装Anaconda与Jupyter Notebook,建立虚拟环境

安装与使用说明:机器学习笔记-Anaconda与JupyterNotebook的简介与使用_LuZhouShiLi的博客-CSDN博客_anaconda jupyter notebook

如果换源失败则参考这篇文章:CondaHTTPError: HTTP 000 CONNECTION FAILED for url <https://mirrors.tuna.tsi解决办法 亲测有效_weixin_49304494的博客-CSDN博客

阅读完上述文章之后,你应该能够

  • 基本了解conda与jupyter
  • 学会在conda中新建一个python环境,并激活他,以后我们就使用你新建的环境进行各项活动。
  • 配置好合适的源
  • 安装,打开,使用jupyter notebook运行python代码,编辑markdown
  • 尝试用notebook访问课程的lab文件(如 lab01.ipynb)

注意我们是在Anaconda Prompt 中进行各种操作,可以从“菜单”中启动。Jupyter NoteBook 也可以从“菜单”中启动,但是默认访问C盘,解决方法见下文。
在这里插入图片描述
效果图:
image-20220903153750828

image-20220903153743819

这里还得补充一个小技巧:
如果想要访问D盘(或者其它盘)的文件,用默认方法打开的jupyter notebook是做不到的(只能访问C盘)。
可以在cmd中输入D:切换到D盘,再输入jupyter notebook,这时就可以访问D盘文件。
(推荐)或者进入到对应的位置,然后打开cmd,然后再conda activate你的环境,再加载notebook。
在这里插入图片描述
在这里插入图片描述

2. 安装各种包

不出意外,当你执行第一行代码,应该会报错

image-20220903153815081

这里的ModuleNotFoundError: No module named 'otter'告诉我们,我们缺少了某些模块,在接下来的代码中,可能还会遇到很多次。

module的安装
  • 一般可以尝试直接安装,引号里的模块。

  • 如果不行,则尝试百度/谷歌这段报错No module named 'otter'

  • 如果还是不行,则百度/谷歌python + 对应的模块名。

下面演示datascience,otter的安装

安装 datascience

data-8/datascience: A Python library for introductory data science

安装方法:pip install datascience

image-20220903164220021

安装otter
  • 第一种:失败

image-20220903154759929

  • 第二种:失败(谷歌的第一个结果答案是错的)

image-20220903154847286

image-20220903154913572

  • 第三种

image-20220903155026648

再最下面可以看到关于otter的介绍,发现它的全称是otter-grader,可以进一步搜索otter-grader,或者尝试pip下载,这里进一步搜索,发现确实有这样的一个模块

image-20220903155231326

如果是谷歌,直接搜到otter-grader的官网,点进去,就会看到安装说明,正解就是pip install otter-grader

image-20220903155252918

image-20220903155337627

题外话,从上例就可以看出有时候百度有多xx吧。如果用不了谷歌也不要紧,可以用这个搜索引擎:Searx Belgium

异常处理

如果你在cmd成功安装了,如图。但是在jupyter还是用不了的话,那就是内核的选择出了问题,请继续阅读。

image-20220903160050065

3.配置kennel(选做)

如果遇到了jupyter无法导入已安装的包的问题,则进行本部分内容。

kennel可以说是python内核,不同的内核其对应的模块是不一样的,下面给出了解决方案。

创建一个新的kennel:【工具配置】【Jupyter】Windows下,为Jupyter创建新的kernel_拾夕er的博客-CSDN博客_jupyter 创建kernel

然后在jupyter中选择新建的内核就可以正常运行第一段代码辣

效果图(我这里新建的内核叫NewKerne3):

image-20220903161116884

image-20220903161219612

03 修改test文件

你是否已经迫不及待的想开始了?下面我们进行data8的第一个问题并评测!

第二个代码块要求你输入secret_word,答案是secret_word = 'welcome'

第三个代码块便是test,运行,可能会出现以下报错:

image-20220903161952716

根据Python Format — Otter-Grader documentation,猜测这个报错大意是test_file缺少定义全局变量OK_FORMAT

image-20220903162134587

解决这个问题也很简单,我们在lab01文件夹下找到test文件夹,修改文件q0.py,在第一行加上OK_FORMAT = True,保存,即可。

image-20220903162325665

成功!!

image-20220903162418101

但是,我们不可能一个一个去改吧…肯定要借助工具批处理,我也不知道为什么会有这个bug,不过还能接受,查阅资料,发现linux下一个命令可以替我们完成这样的需求。

Shell三大利器之sed - 腾讯云开发者社区-腾讯云

学习上述命令之后,编写以下shell脚本,大意是,给当前文件夹的所有.py文件的第一行添加OK_FORMAT = True

保存后 用git bash打开即可。(对于每个测试文件夹都应修改一次)

image-20220903162634782

不出意外接下来就可以开始你的data8之旅了!

04 结语

不出意外的话,各个部分应该是可以正常运行的了,有可能会有一些包没安装,那么就安装好了,要是还有其它问题,那就谷歌/百度,借鉴前人经验的动手解决问题,是每一个都应具备的能力。希望你能成功配置环境,既收获劳动的喜悦,也收获解决问题能力。

本文肯定还有很多不完善的地方,如果你的问题没有在此出现,希望你能够使用搜索引擎寻找自己的答案,实在不行当然也欢迎在评论区里提出,另外如本文有错误或者不足,烦请读者批评指正。

  • 9
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值