机器学习和传统统计学

数据科学和人工智能兴趣组

已于 2024-09-13 21:15:48 修改

阅读量805

点赞数 17

分类专栏：（免费）R语言学习专栏文章标签：机器学习人工智能 r语言数据结构临床数据科学

于 2024-09-13 21:15:21 首次发布

本文链接：https://blog.csdn.net/2301_79425796/article/details/142220269

版权

（免费）R语言学习专栏专栏收录该内容

267 篇文章 6 订阅

订阅专栏

下面内容摘录自《用R探索医药数据科学》专栏文章的部分内容。栏目后续章节的文章将深入概括R语言在临床研究和新药创新领域的应用，填补了国内R教材中尚未广泛覆盖的部分内容。

1章2节：关于人工智能、机器学习、统计学与 ChatGPT 的探究 (更新20240814)-CSDN博客文章浏览阅读1.1k次。在现代科技发展的浪潮中，人工智能（AI）、机器学习（ML）、统计学、R 编程语言以及大型语言模型（如 ChatGPT）已经成为推动创新和解决复杂问题的关键力量。这些技术之间不仅存在密切的联系和相互的作用，而且还存在一定的区别，本文一一探索。https://blog.csdn.net/2301_79425796/article/details/140560500?csdn_share_tail=%7B%22type%22%3A%22blog%22%2C%22rType%22%3A%22article%22%2C%22rId%22%3A%22140560500%22%2C%22source%22%3A%222301_79425796%22%7D

欢迎订阅我们专栏

.......前面部分请点击上面链接看原文（原文5773字）

一、人工智能

在过去的 60 年间，数据、事实以及信息呈现出爆发式的增长，特别是在人类基因编码领域中的数据，这一现象标志着一个全新时代的降临，即大数据时代。计算机技术能够将这个世界上浩如烟海的数据转化为知识、事实和信息。

........

二、机器学习

机器学习（Machine Learning，ML）则是人工智能的一个分支，致力于开发能够从数据中学习和改进其性能的算法和统计模型。简而言之，机器学习让计算机通过分析大量数据自行“学习”并做出预测或决策，

........

三、机器学习和传统统计学

机器学习和传统统计学是数据科学中相辅相成的两个重要分支。机器学习主要侧重于开发和使用算法来识别数据中的模式，并对未知事物进行预测和分类，它强调自动化和处理大规模数据的能力，通过训练模型从数据中进行学习，以实现高效的预测和识别任务。而传统统计学则注重对数据进行深入的推断分析，着重于因果关系的识别和结果的解释，强调理论基础和假设检验，通过严谨的方法论来推导出数据背后的规律和意义。两者在数据科学中都是不可或缺的，它们共同为我们提供了理解和利用数据的工具，既能帮助我们做出准确的预测，又能帮助我们揭示数据中潜在的因果关系。

特点	机器学习	传统统计学
重点	预测和识别未知事物	推断分析、因果识别和结果解释
目标	训练模型进行预测和分类	通过数据描述、估计模型参数，进行统计推断
方法	数据驱动的方法，使用大量数据进行模型训练	假设驱动的方法，通过样本数据推断总体特性
数据处理	能处理大规模数据集和高维数据	通常处理较小规模数据集和低维数据
模型复杂性	可使用复杂的非线性模型（如神经网络、SVM等）	通常使用较为简单的线性模型和假设检验
评估标准	关注模型在新数据上的预测性能和泛化能力	关注模型参数的估计精度和假设检验的显著性
应用场景	自动驾驶、语音识别、推荐系统、图像分类等	社会科学研究、医学研究、经济学分析等
训练和验证	通过交叉验证、训练集和测试集来评估模型	使用置信区间、p值等统计指标评估模型
处理不确定性	通过概率模型和正则化技术应对不确定性	通过假设检验和置信区间处理不确定性
优势	强大的预测能力和适应性，对新数据有良好表现	深入的解释能力和因果推断，提供数据背后的洞见

机器学习是人工智能研究的核心，也是实现人工智能的根本途径。

例如，人工智能的语言识别技术使计算机能够理解和处理人类语言，从而实现人与计算机之间的自然交流。这项技术在语音助手、翻译软件、客服系统等方面得到了广泛应用。例如，苹果的Siri、谷歌助手和亚马逊的Alexa等语音助手已经成为日常生活的一部分，它们能够回答问题、执行命令，甚至进行闲聊，大大提升了用户体验。图像识别技术使计算机能够“看见”并理解视觉信息。通过分析和处理图片或视频中的信息，计算机可以执行如面部识别、物体检测、图像分类等任务。这项技术在安全监控、医疗诊断、自动驾驶等领域发挥了重要作用。人工智能还可以通过分析生物医学数据和化学信息，AI能够发现潜在的药物靶点，预测药物的毒性和有效性，优化药物设计。此外，AI还可以帮助筛选已有药物库，发现新的药物用途，这在疫情等紧急情况下尤其重要。

R与ChatGPT

R语言也是机器学习的重要工具之一。基础R环境中包含许多机器学习算法，如R的基础包stats中就有线性回归模型、逻辑回归模型、聚类分析和k均值聚类等。此外，越来越多的机器学习R扩展包不断涌现，使得R用户能够方便地使用最新的机器学习技术。

ChatGPT，作为OpenAI开发的一种先进的自然语言处理模型，能够理解和生成类似人类的文本。通过将R语言与ChatGPT结合，用户可以实现更智能的文本分析和自然语言处理任务。例如，用户可以利用R语言的强大数据处理能力对文本数据进行预处理，然后使用ChatGPT生成上下文相关的文本回复，或进行文本分类、情感分析等任务。这种结合不仅提高了数据分析的效率，还拓展了R语言在自然语言处理领域的应用范围。

上图，R语言中chatgpt包的详细指南，介绍了该包的基本功能、安装方法、技术细节、如何获取帮助以及相关资源。chatgpt包通过提供一个与GPT-3语言模型交互的界面，帮助R开发者生成对话风格的文本，并支持在R环境中进行高效的编码任务。网页还提供了包的作者信息、许可证类型、依赖关系等技术细节，并推荐了获取帮助的多种资源，包括内置帮助系统、包的专用网站、开发者支持以及在线课程和讨论论坛。

.......................

在这里，你学到的并非仅仅是 R 的某一个技巧，而是能够从零开始，深入且系统地学习 R 语言。此外，本专栏每周至少定期更新三篇文章，每篇文章篇幅均在 5000 字以上。而且，对于已经发表的知识点，我们也会根据新的技术或理解及时进行更新，这是纸质版图书无法做到的。为了让更多的忠实粉丝和同学们享受到实惠，本专栏采用折扣定价策略。随着章节的不断完成，折扣力度会逐渐减小。所以，现在正是订阅的最佳时机！

https://blog.csdn.net/2301_79425796/category_12729892.html?spm=1001.2014.3001.5482