- 博客(15)
- 资源 (14)
- 收藏
- 关注
原创 安卓进阶系列-07数据库框架(GreenDAO)的使用
GreenDAO的使用简介安卓提供了一个占用内存极小的数据库SQLite,也提供了不少操作数据库的API,然而不是所有程序员都擅长编写SQL语句,这时一个ORM的数据库框架就显得很好用了。在之前的博客我已经提到了LitePal的使用,但是实际开发中使用的LitePal的项目并不多,相反很多时候GreenDAO是一个不错的选择。当然,现在的开发很多至关重要的用户数据都是部署在服务器上的大...
2019-01-31 13:28:07 326
原创 Python工具包-分词工具pkuseg
pkuseg使用简介最近社区推了一些文章介绍了北大开源的一个新的中文分词工具包pkuseg。它在多个分词数据集上都有非常高的分词准确率。其中广泛使用的结巴分词(jieba)误差率高达18.55%和20.42%,而北大的pkuseg只有3.25%与4.32%。在中文处理领域,特别是数据分析挖掘这个领域,数据预处理重要性不言而喻,那么分词的重要性也是不言而喻的。简单使用pkuseg这个包,...
2019-01-28 16:03:02 7601 7
原创 安卓进阶系列-06数据库框架(LitePal)的使用
LitePal的使用背景安卓内置了一个轻量数据库SQLite,然而很多时候使用SQLite是不方便的,更多开发者习惯服务器部署MySQL之类的数据库,而且复杂的SQL语言对于很多没有系统学习过数据库和关系数学的开发者来说略有难度。这个时候ORM模型的出现就应运而生了,一个类对应一个表,一个对象对应表中的一条记录,增删查改功能全部帮你封装好,这是个开源的时代了。常用的ORM安卓框架有Or...
2019-01-27 17:08:43 414
原创 机器学习-分类之AdaBoost原理及实战
AdaBoost算法简介当一个分类器正确率不那么高时,称其为“弱分类器”,或者说该分类器的学习方法为“弱学习方法”。与之对应的,存在“强分类器”和“强学习方法”。强学习方法的正确率很高。AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。AdaBoost是Adaptive Boost...
2019-01-26 18:15:19 541
原创 数据分析与挖掘实战-应用系统负载分析与磁盘容量预测
应用系统负载分析与磁盘容量预测背景某大型企业为了信息化发展的需要,建设了办公自动化系统、人力资源管理系统、财务管理系统、企业信息门户系统等几大企业级应用系统。因应用系统在日常运行时,会对底层软硬件造成负荷,显著影响应用系统性能。一般认为,影响应用系统性能的因素包括:服务器、数据库、中间件和存储设备。任何一种资源负载过大,都可能会引起应用系统性能下降甚至瘫痪。因此,需要关注服务器、数据库、...
2019-01-26 15:28:56 1964
原创 Linux服务-FTP文件服务器部署
FTP服务搭建简介 文件传输协议 FTP共享是基于TCP/IP协议 C/S FTP服务器共享按照文件目录来组织的 FTP只支持TCP不支持UDP 两个端口:一个数据端口一个控制端口(命令端口) 端口 21端口 命令端口,用于接受客户端执行的FTP命令 20端口 数据传输,用于上传下载文件数据 由于FTP工作方式四不同,数据端口不一定一直...
2019-01-22 21:24:03 444
原创 机器学习-机器学习概论(入门机器学习基础知识)
机器学习简介 机器学习一词来源于Machine Learning的翻译,主要研究计算机模拟或者实现人类的行为,顾名思义,像学生一样,通过学习获取新的知识或者技能,完善自身的知识结构,并不断提升自己的性能。 机器学习是人工智能的核心,其应用编辑人工智能的多个领域,如图像处理、人脸识别、自然语言处理(NLP)、数据挖掘、生物特征识别、检测信用卡欺诈、证券市场分析、语音和手写识别等。 工...
2019-01-21 20:48:27 623
原创 数据分析与挖掘实战-家用电器用户行为分析与事件识别
家用电器用户行为分析与事件识别背景 居民使用家电过程中,会因为地区气候、区域不同、年龄差异,形成不同的使用习惯,若能深入了解这些习惯,针对性地开发新功能,便能开拓市场。 本案例以热水器为例,分析用户行为。在热水器用户行为分析过程中,用水事件识别最为关键。 目标 由于热水器可能用于各种事件而不仅仅是洗浴,要求根据收集到的数据,分析用户行为。 基于热水器采集到的时间序列数据,将顺...
2019-01-21 13:17:24 3796 1
原创 Linux服务-NFS服务部署
NFS网络文件服务部署(rhel7)说明 使用rhel7作为服务端,ubuntu作为客户端。 简介 Network File System 网络文件系统 用于unix/类unix系统之间进行文件共享 开发者 sun 版本 NFSv2 NFSv3 NFSv4 NFS端口 tcp 2049 工作原理 C/S RPC 远...
2019-01-20 19:50:02 343
原创 Linux服务-DHCP服务部署
DHCP服务器搭建(rhel7)说明 本次搭建使用rhel7作为服务器,ubuntu作为客户端。 简介 DHCP(Dynamic Host configuration Protocol)动态主机配置协议 DHCP协议可以为客户端自动发放TCP/IP参数信息 ip地址,子网掩码,网关,DNS等信息 避免了一些繁琐的地址配置操作 前提 服务器必须是一个唯一的ip,不能...
2019-01-20 16:32:42 335
原创 数据分析与挖掘理论-常用算法对比(纯理论较枯燥)
常见数据挖掘算法分析概述 一般认为,数据挖掘领域所使用的方法均属于机器学习算法、深度学习算法和数据挖掘算法。 一般认为,数据挖掘领域的问题主要有分类、回归、聚类、推荐、图像识别、预测。 一般认为,数据挖掘领域所牵扯到的底层知识有“概率论”、“数论”、“统计学”、“线性代数”、“数字图像处理”、“机器学习理论基础”、“高等数学”。当然,你也不一定很清楚原理,事实上很多数据挖掘师会用算法...
2019-01-07 22:22:10 1765
OpenCV安装过程缺失文件
2022-03-11
mathpix安装包(201910月更新)
2019-09-27
基础学习路线.mmap
2019-05-19
Mathpix软件安装包
2019-04-17
windows右击新建.md文件的注册表脚本
2018-11-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人