背景:18年底互联网寒冬,12月本小白换工作了,不再做游戏相关了,新入职了然后开始做NLP相关的,接下来会不断更新工作中遇到的一些问题
第一天需要先熟悉一下tensorflow,以前学校自己只是用caffe框架做过简单的图像分类相关
所以对于tf也是开始入门。
第一天对一个新的空白电脑,先安装我们需要的环境,
1,git(github是宝库这个记得)
2,XShell(windows对coder真的很不友好,怀念以前mac下Terminal+OhMyZsh)
3,python(版本3.6.7,这个版本就是我踩的第一个大坑,后面会说)
4,pycharm(python开发最爱IDE)
5,再装个sublime3差不多就可以开始干活了,剩下你可以自己装一下微信云盘,印象笔记等好用的东西
这些做好之后,我们开始再pycharm中配置好虚拟环境
然后再setting中安装各种需要的package,我是ML出身,所以第一时间装了一堆ML的包
numpy 可以高效的处理数据,提供数组支持,很多模块都以来他,比如pandas,scipy,matploylib都以来他,所以这个模块是基础。
pandas 用于进行数据探索和数据分析
scipy 主要进行数值计算,同时支持矩阵运算,并提供了很多高等数据处理功能,比如积分,傅里叶变换,微分方程求解等
matplotlib 作图模块,解决可视化问题
statsmodels 主要用于统计分析。
Gensim 这个模块主要用于文本挖掘。
sklearn 机器学习
keras 深度学习
jieba 用于分词,对于英文可以空格分词,中文分词需要词典;jieba中还有多种模式,同时jieba还可以关键词的提取
tflearn 深度学习,对tensorflow进一步封装
图像处理工具 opencv
当然这些可以通过pip安装,但是pip安装一般需要在命令行执行后续的操作,我习惯用pycharm,所以希望都安装在pycharm中,将来执行代码方便自己debug。
装好之后,可以进行我们tf的工作了。
1,Tensorflow安装失败
安装tf的时候直接报错Non-zero exit code (1)
通过detail,建议更新pip版本,先试着在pycharm中更新pip从10.1更新18.1失败
然后在终端cmd中进入相应的pycharm的虚拟环境的目录下,尝试用python -m pip install --upgrade pip升级pip还是报错,未解决。
此时的报错信息
Could not find a version that satisfies the requirement tensorfllow (from versions: )No matching distribution found for tensorflow
然后尝试了更新pip后重启机器的方法仍无法解决
经过各种尝试发现这个原因是由于版本不匹配的原因
在于TensorFlow 的安装包1.12.0目前windows版本还不支持 Python 3.7 。昨天安装环境就装了一个最新的python3.7,结果tf可能还不支持3.7,没办法又卸载了3.6,重装了3.6,然后setting直接安装tf成功
在安装tf时候会自动给你装numpy,以及pip还是10.0.1,不需要升级到18.1
然后用一个脚本测试一下安装效果
import tensorflow as tf
hello = tf.constant('Hello, TensorFlow!')
sess = tf.Session()
print(sess.run(hello))
Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2
b'Hello, TensorFlow!'
暂时有这个报错,由于下载的tf不支持avx2编译,暂不影响先不管
---------------------