自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 技术书籍推荐

——来自codesheep(bilibili) 1、c语言: C primer plus(指针和内存管理) 2、c++: c++primer plus 3、java: java编程思想、java核心技术 4、python: python核心编程、python编程从入门到实践 5、Go: Go语言实...

2020-01-18 23:07:15

阅读数 28

评论数 0

原创 数据分析学习参考的免费高质量视频

https://www.bilibili.com/video/av61947066 外国小哥哥思路清晰,手把手从安装到以一个实战熟悉SQL

2020-01-18 13:02:05

阅读数 39

评论数 0

原创 jupyter notebook的快捷键

jupyter notebok中有很多快捷键,我们记住以下几个,可以方便以后的操作: 首先,区分单元格的命令模式和编辑模式,因为在不同模式下的快捷键有所区分。 命令模式:单元格框为蓝色 编辑模式:单元格框为绿色 命令模式下的快捷键: m(转化为markdown模式) y(转化为code模式) e...

2020-01-14 13:21:29

阅读数 100

评论数 0

原创 Anaconda如何安装、卸载、更新、查看库?

conda包库管理器,下载卸载更新查看库 以安装tensorflow库为例 (virtual) C:\Users\Admin>conda install tensorflow 或 (virtual) C:\Users\Admin>pip install tensorflow...

2020-01-13 21:46:31

阅读数 102

评论数 0

原创 Anaconda 如何创建新的虚拟环境?

文章目录1、创建虚拟环境2、激活与反激活虚拟环境3、查看虚拟环境及其他信息4、conda包库管理器,下载卸载更新查看 1、创建虚拟环境 创建虚拟环境的目的:满足存在多个项目需要不同运行环境的情况。 创建方法:在Anaconda Prompt中输入 conda create -n virtu...

2020-01-13 16:12:00

阅读数 93

评论数 0

原创 数据分析之excel(一)快捷键/绝对,相对引用/替换查找和日期函数

help you excel in office work

2020-01-12 22:13:33

阅读数 76

评论数 0

原创 怎样成为一名合格的数据分析师?

数据分析学习路线 文章目录数据分析学习路线1、统计学2、SQL3、python4、R、SAS、spss5、hadoop和Hive6、聚类、主成分相关算法7、机器学习 1、统计学 2、SQL 3、python 4、R、SAS、spss 5、hadoop和Hive 6、聚类、主成分相关算...

2020-01-05 21:02:47

阅读数 104

评论数 0

原创 数据分析相关概念和基础操作

文章目录1、商业智能 BI、数据仓库 DW、数据挖掘 DM2、元数据、数据元3、数据挖掘(1)、几个重要的数据挖掘任务(2)、数据挖掘过程(3)、数据清洗示例 1、商业智能 BI、数据仓库 DW、数据挖掘 DM 商店利用数据预测用户购物行为属于商业智能,他们积累的顾客的消费行为习惯会存储在数据...

2019-03-04 22:27:37

阅读数 166

评论数 0

原创 NLP之三特征提取

1、基本文本处理技能 (1)、分词的概念 分词的正向最大 分词的逆向最大 分词的双向最大匹配法 (2)、词、字符频率统计 可使用python的collections.Counter模块,也可以用自己找到的其他更好用的库 2、语言模型 (1)、unigram、bigram、trigram概念 (...

2019-03-03 23:09:10

阅读数 257

评论数 0

原创 自然语言处理之二NLP之数据集探索

NLP之数据集探索 1、IMDB数据集下载和探索 2、THUCNews数据集下载和探索 数据集链接: https://pan.baidu.com/s/15p_W4EPXEVSZ7GxQ_lkISg 提取码:0mmy 参考链接: 1、CNN字符级中文文本分类-基于TensorFlow实现...

2019-03-03 18:06:49

阅读数 125

评论数 0

原创 自然语言处理之一NLP基础

自然语言处理基础 1、学习说明 学习自然语言处理理论,并且通过对某些数据集的文本分类任务不断优化来进行实践。 任务路线: 特征提取——>特征选择——>文本表示——>传统机器学习算法跑模型——&a...

2019-03-03 14:42:53

阅读数 78

评论数 0

原创 机器学习之二用sk-learn实现波士顿房价预测(单变量)

1、使用sk-learn进行波士顿房价预测的过程 (1)、波士顿地区房价数据获取,数据来自于sklearn自带数据集; (2)、波士顿地区房价数据分割; (3)、训练与测试数据标准化处理; (4)、使用最简单的线性回归模型LinearRegression对房价进行预测。 2、回归性能评价...

2019-03-03 13:39:35

阅读数 550

评论数 0

原创 解决弃用警告:This module was deprecated in version 0.18 in favor of the model_selection modul into which a

弃用警告消除 在pycharm中导入sklearn.cross_validation模块时,发现以下warning而不是error,说明程序虽然可以正常使用但是有警告出现: from sklearn.cross_validation import train_test_split C:\User...

2019-03-03 10:47:44

阅读数 205

评论数 0

原创 python爬虫的5个实例

文章目录1、京东商品页面的爬取2、亚马逊商品页面的爬取3、百度、360搜索关键字提交 1、京东商品页面的爬取 爬虫具体流程可以参照前一篇博客:https://blog.csdn.net/weixin_42515907/article/details/87932185 import reque...

2019-03-02 23:51:16

阅读数 1706

评论数 0

原创 机器学习之一线性回归算法

文章目录1、机器学习相关概念2、线性回归的原理3、线性回归损失函数、代价函数、目标函数的概念4、一元线性回归的参数求解公式推导5、多元线性回归的参数求解公式推导6、线性回归的评估指标有哪些?原理是什么?7、sklearn参数详解(sklearn包里面线性回归的每个参数的作用) 1、机器学习相关概...

2019-02-28 18:09:36

阅读数 237

评论数 0

原创 轻量级标记语言Markdown的使用方法(多级标题,列表,LaTex公式)

文章目录1、换行2、斜体3、加粗4、粗斜体5、分割线6、标题7、列表8、代码框9、插入图片 1、换行 在前一行后面输入两个以上空格再输入第二行才可以换行 2、斜体 *文字* 3、加粗 **文字** 4、粗斜体 ***文字*** 5、分割线 三个或者三个以上* *** 6、标...

2019-02-28 10:45:36

阅读数 97

评论数 0

原创 python网络爬虫基础知识

python网络爬虫与信息提取 1、目标 掌握定向网络数据爬取和网页解析的基本能力 the website is the API (将网站作为API获得自己想要的数据) 2、学习过程 (1)、requests库 自动爬取HTML页面,自动向网络提交请求 (2)、robots.txt...

2019-02-26 11:43:35

阅读数 94

评论数 0

原创 软测基础知识介绍

文章目录1、何为软测2、软测的目的3、软测定义4、软测原则:5、软测产品质量模型(ISO9126):6、软件质量模型保证(SQA):7、QC和QA 1、何为软测 规定条件下对程序进行操作,从而发现问题,对软件质量进行评估的过程。 2、软测的目的 以最小的人力物力和时间找出软件中的缺陷并修改...

2019-02-25 22:05:44

阅读数 155

评论数 0

原创 关于域名服务器和网站上传

域名: 就是常见的网址,类似"www.baidu.com"的名称,是域名提供商提供的和数字ip地址对应的网络地址,帮助找到并且登入网络。 如下:www.baidu.com可以进入百度网页 直接输入115.239.210.27也可以进入这个网页 C:\Use...

2019-02-25 19:03:58

阅读数 78

评论数 0

原创 dos常用操作

1、windows+R打开运行窗口,输入cmd进入命令行界面。 2、查看电脑的物理ip地址信息: ipconfig/all 以太网的物理地址(mac地址)是每一台计算机的唯一地址(是16进制的数字),公司网管需要把这个地址绑定在路由器上,你的电脑才可以上网。 3、查看ip地址与物理地址的...

2019-02-25 18:39:22

阅读数 69

评论数 0

原创 自动化采集数据的方法

1、开放数据源:一般是针对行业的数据库。 2、爬虫抓取:抓取特定的网站数据。 编程爬虫的三大利器:requests、Xpath、pandas。使用requests爬取内容;使用Xpath解析内容;使用pandas保存数据。 其他采集器:火车采集器、八爪鱼、集搜客 3、日志采集:统计用户的操作。可以...

2019-02-25 17:23:35

阅读数 235

评论数 0

原创 用户画像建模的基本步骤

用户画像的准则: 将自己企业的用户画像做个白描,表明用户“都是谁”、“从哪来”、“要去哪”。用户画像建模就是现实中的数学建模活动。 用户画像建模的三步: 第一步:统一化。统一用户的唯一标识。 唯一标识可以是:用户名、注册手机号、邮箱、cookieID等 第二步:标签化。 给用户打标签,即...

2019-02-25 17:09:12

阅读数 1270

评论数 0

原创 软件测试之计算机基础知识

文章目录**什么是软件测试?****计算机基础知识****1、pc:** 现今用于高速运算的电子机器,具有记忆功能,可以高速处理数据。**2、** **计算机系统分类:** 硬件和软件系统。**3、B/S和C/S架构:****什么是二进制?** 什么是软件测试? 软件测试就是给软件做质检。 ...

2019-02-24 14:53:22

阅读数 144

评论数 0

原创 使用SQL语句来操作pandas

使用SQL语句来操作pandas 在python里,可以直接使用SQL语句来操作pandas。适用于有些人难以记住pandas中操作dataframe的语句时,SQL对数据表的操作更接近于我们的自然语言。 使用的工具包是pandasql。 pandasql中的主要函数是sqldf,可以传入两个参...

2019-02-24 13:47:36

阅读数 312

评论数 0

原创 pandas的两种基本数据结构series和datarframe

python的重要工具pandas 博客中代码在jupyter notebook中实现 pandas是基于numpy构建的含有更高级数据结构和数据分析能力的工具包。numpy中数据结构是围绕ndarray展开的,pandas中数据结构是围绕Series和dataframe展开的。 1、Ser...

2019-02-11 15:48:56

阅读数 120

评论数 0

原创 Jupyter在指定文件夹下打开的方法

jupyter notebook是一个基于网页的用于交互计算的应用程序。其可被应用于全过程计算:开发、文档编写、运行代码和可视化展示结果,可以使代码开发者保持更高的逻辑性。下面介绍的是如何创建一个jupyter项目。 1、首先打开Anaconda下面的Anaconda Prompt(注意不是cm...

2019-02-02 12:24:32

阅读数 3290

评论数 2

原创 python函数

函数定义和调用 def addone(score): return score + 1 print(addone(99))

2019-01-31 20:15:57

阅读数 70

评论数 0

原创 python导入模块/包

导入一个模块 import model_name 导入多个模块 import module_name1,module_name2 导入包中指定模块 from package_name import moudule_name 导入包中所有模块 from package_na...

2019-01-31 20:14:44

阅读数 87

评论数 0

原创 python注释

#-*- coding: utf-8 -* 用于有多行注释的代码开头 #这是单行注释,用一个#号 ''' 这是多行注释,用三个单引号 这是多行注释,用三个单引号 这是多行注释,用三个单引号 ...

2019-01-31 20:12:21

阅读数 72

评论数 0

原创 python基本数据类型列表、元组、字典、集合

数据类型 文章目录数据类型1、列表2、元组3、字典3.1 定义字典3.2 添加3.3 删除3.4 查询3.6 修改3.7 遍历3.7.1 遍历键和值3.7.2 只遍历键3.7.3 只遍历值3.8 基于字典的模糊查找4、集合 1、列表 lists = ['a','...

2019-01-31 19:59:09

阅读数 82

评论数 0

原创 python条件判断和循环语句

1、if else 语句 #需要使用int进行强制类型转换,否则接下去会报错 #python格式要求严格,代码缩进要注意 while (True): score = int(input("what's your score?")) ...

2019-01-31 19:27:25

阅读数 76

评论数 0

原创 python输入和输出

输入和输出 键盘获取输入: name = input("What's your name?") sum = 100+100 print ('hello,' ,name) print ('sum = ' ...

2019-01-31 19:15:18

阅读数 77

评论数 0

原创 python字符串处理

文章目录字符串处理1. split拆分字符串2. strip删除字符串前后的空格3. join连接列表的字符串4. 大小写转换5. 字符与ASCII码的转换6. 英文字母判断7. 组合字符判断 字符串处理 1. split拆分字符串 words="To be or ...

2019-01-31 19:08:19

阅读数 93

评论数 0

原创 python列表索引与切片

文章目录列表索引与切片1. 列表索引(查询)2. 列表切片(取出原列表的子列表,生成一个新的列表)3. 列表元素顺序反向4. 替换列表某段子列表5. 在列表开头插入元素 列表索引与切片 1. 列表索引(查询) # 正索引 list=[1,2,3,4,5] print("...

2019-01-31 19:06:16

阅读数 512

评论数 0

原创 python赋值操作

文章目录1、赋值运行1.1 多赋值1.2 元组赋值1.3 同步赋值1.4 自操作简化 1、赋值运行 1.1 多赋值 a=b=c=1 print("a="+str(a)) print(&am...

2019-01-31 19:04:00

阅读数 101

评论数 0

原创 git安装和最小配置

git安装和最小配置 mac、linux、windows的不同安装方法和安装包链接 以windows系统为例: 进入该链接之后,将会自动匹配电脑的相关配置以及电脑是32/64位的,下载完成后点击.exe文件进行安装,只要一直点下一步就可以。安装完成之后,我们可以按住“windows键+R”打开任务...

2019-01-29 16:21:10

阅读数 65

评论数 0

原创 用python开发一个有趣的猜数字小游戏(实现简单的GUI界面学习)

文章目录用python开发一个有趣的猜数字小游戏相关知识1、 python的GUI编程1.1 pythonGUI常用库对比1.2 tkinter组件1.2.1 tkinter组件列表1.2.1 tkinter组件共同标准属性1.2.1 tkinter组件位置管理方法1.3 tkinter.mess...

2019-01-22 00:02:58

阅读数 1114

评论数 0

转载 python中Tkinter的布局管理器Grid

Grid(网格)布局管理器会将控件放置到一个二维的表格里。主控件被分割成一系列的行和列,表格中的每个单元(cell)都可以放置一个控件。   什么时候使用Grid管理器   grid管理器是Tkinter里面最灵活的几何管理布局器。如果你不确定什么情况下从三种布局管理中选择,你至少要保证自己...

2019-01-21 22:35:39

阅读数 233

评论数 0

转载 Tkinter颜色参照

colors = ‘’’#FFB6C1 LightPink 浅粉红 ,#FFC0CB Pink 粉红 ,#DC143C Crimson 深红/猩红 ,#FFF0F5 LavenderBlush 淡紫红 ,#DB7093 PaleVioletRed 弱紫罗兰红 ,#FF69B4 HotPink 热...

2019-01-21 17:54:40

阅读数 100

评论数 0

原创 python文件操作

文章目录文件操作1.1 open函数1.2 读写文件1.3 不同模式打开文件的完全列表: 文件操作 1.1 open函数 用于打开一个文件,创建一个 file 对象,相关的方法才可以调用它进行读写。 语法:open(name, mode, buffering) 参数说明: name :...

2019-01-20 22:24:33

阅读数 62

评论数 0

提示
确定要删除当前文章?
取消 删除