python犯法_机器学习 -- 朴素贝叶斯（案例：预测旧金山犯罪）

最新推荐文章于 2023-04-23 10:56:53 发布

weixin_39837041

最新推荐文章于 2023-04-23 10:56:53 发布

阅读量734

点赞数

文章标签： python犯法

本文通过分析旧金山犯罪数据集，选择伯努利朴素贝叶斯模型进行预测。首先对数据进行预处理，包括类别编码和特征因子化，然后使用训练集与测试集划分数据，最后训练模型并评估预测精度约为22%。

摘要由CSDN通过智能技术生成

一. 下载数据集

二. 数据集读取

将train.csv放到和python文件的同级目录下，便于使用。

（1）导入需要的模块和包。

import pandas as pd

from sklearn import *

（2）读取文件。

train_df = pd.read_csv('train.csv')

（3）读取文件内容如下：

watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L20wXzM4MDU2ODkz,size_16,color_FFFFFF,t_70

三. 数据集类别和特征的选取

观察上图数据集，有日期、犯罪种类、描述、星期几、解决方案、地址及XY坐标等多列。我们将“犯罪类别”设置为类别，同时这里不将“罪行描述”、“X/Y坐标”、“结果”作为其特征。

四. 选择合适的朴素贝叶斯模型

sklearn提供了三种朴素贝叶斯模型，选择一个最适合的作为旧金山的犯罪预测。

模型名称

数据分布

特征特点GaussianNB（高斯朴素贝叶斯模型）

连续式数据

特征的数据连续

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39837041

关注关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python实现基本正则匹配、贝叶斯预测、情感分析、旧金山犯罪预测

10-23

python实现，包含贝叶斯估计、情感分析、分词等几个文件

Python算法练习（七）// 算法：朴素贝叶斯，数据集：Kaggle 旧金山犯罪分类预测

cqx2020的博客

04-15

1464

一、导入包二、导入数据三、探索数据四、数据预处理五、模型构建与评估六、预测

参与评论您还未登录，请先登录后发表或查看评论

python基于机器学习模型开发实践kaggle旧金山犯罪案件分类预测模型

Together_CZ的博客

04-23

2260

python基于机器学习模型开发实践kaggle旧金山犯罪案件分类预测模型 lightGBM/RF/DT/SVM/AdaBoost/GBDT

贝叶斯分类之旧金山犯罪分类预测

ggwcr的博客

09-14

3199

贝叶斯分类之旧金山犯罪类型分类预测学习七月算法朴素贝叶斯分类器中项目的一个例子，这也是一个Kaggle比赛的例子。通过训练来预测犯罪类型。环境： win7 64位 python3.51、加载数据该数据是旧金山12年的犯罪记录，数据文件是一个csv文件可以使用pandas来加载数据，数据内容摘录： Dates,Category,Descript,DayOfWeek,PdDistrict,Resolu

Python小案例:预测小偷行为

黑马程序员广州中心的专栏

01-15

351

案件回顾杂货店屡遭贼 1，杂货店遭小偷情况严重 2，现有8个月内，每天的失窃纪录 3，偷窃者有老顾客家属和学生，店主希望能防患于未然（问题：失窃是否有规律？怎样运用规律堤防盗贼？）时间序列分析将数据存储为csv格式，导入python，查看前10行数据。 [Python]纯文本查看复制代码 ? 1 2 3 4 5 ...

机器学习 -- 朴素贝叶斯（案例：预测旧金山犯罪）

Leo的博客

10-28

4648

一. 下载数据集下载地址为：https://www.kaggle.com/c/sf-crime/data。二. 数据集读取将train.csv放到和python文件的同级目录下，便于使用。（1）导入需要的模块和包。 import pandas as pd from sklearn import * （2）读取文件。 train_df = pd.read_csv('tr...

机器学习-Python-朴素贝叶斯-垃圾邮件

09-28

在IT领域，机器学习是一种利用数据来让计算机学习并做出预测或决策的先进技术。Python作为一门强大且易学的编程语言，是实现机器学习任务的首选工具。本资源包聚焦于一个具体的机器学习应用——垃圾邮件检测，通过...

Python机器学习(scikit-learn)：监督学习 - 朴素贝叶斯（分类器）-谢TS的博客.pdf

最新发布

07-19

在机器学习领域，尤其是 Python 的 `scikit-learn` 库中，朴素贝叶斯算法是常用的数据分类方法之一。与线性模型，如 Logistic Regression 和 LinearSVC 相比，朴素贝叶斯分类器的训练速度更快，但可能在泛化能力上稍...

人工智能-项目实践-朴素贝叶斯分类器-朴素贝叶斯文本分类器

03-25

人工智能_项目实践_朴素贝叶斯分类器_朴素贝叶斯文本分类器 **数据：**搜狗文本分类语料库 **分类器：**朴素贝叶斯分类器 NBC(Naive Bayesian Classifier) **编程语言：**Python+jieba分词库+nltk+sklearn

旧金山犯罪案件分类预测.ipynb

03-29

旧金山犯罪案件分类预测.ipynb

朴素贝叶斯算法的python实现方法

12-24

本文实例讲述了朴素贝叶斯算法的python实现方法。分享给大家供大家参考。具体实现方法如下： 朴素贝叶斯算法优缺点优点：在数据较少的情况下依然有效，可以处理多类别问题缺点：对输入数据的准备方式敏感适用数据类型：标称型数据算法思想：比如我们想判断一个邮件是不是垃圾邮件，那么我们知道的是这个邮件中的词的分布，那么我们还要知道：垃圾邮件中某些词的出现是多少，就可以利用贝叶斯定理得到。 朴素贝叶斯分类器中的一个假设是：每个特征同等重要函数 loadDataSet() 创建数据集，这里的数据集是已经拆分好的单词组成的句子，表示的是某论坛的用户评论，标签1表示这个是骂人的 createVoca

sklearn机器学习旧金山犯罪分类数据

10-18

sklearn机器学习使用旧金山犯罪分类数据，分为测试集、训练集等。属于多分类问题，提供的数据特征包含时间、地点、描述等。花了不少时间才从公开数据网站kaggle上下载到。

基于python的犯罪数据的可视化预警分析

小庄同学的博客

03-16

6809

本文灵感来源于Kaggle比赛-旧金山犯罪预测。小编感觉在犯罪打击上面，数据可视化能够很好的做到犯罪打击，给公安机关提供良好的分析依据和可视化的预警效果。因为犯罪数据基本上不公开，我们本文用到的是Kaggle比赛里面提供的旧金山2015年犯罪的开源数据。话不多说，直接上干货！本文使用的是jupyter Notebook。大家可以下载Anaconda，里面自带jupyter ...

解密犯罪事件Python实现

s2624372910的博客

03-24

544

def Solution(tim): tim = list(tim.replace(":","")) time = list((int(i) for i in tim)) if time[3] > time[2] and time[3] < 6: time[2] = time[3] time = list((str(i) for i in time)) time.insert(2, ":") time = .

基于法律裁判文书的法律判决预测

weixin_45585364的博客

11-22

4495

点击上方蓝字关注我们基于法律裁判文书的法律判决预测张虎1,潘邦泽1,谭红叶1,李茹1,21山西大学计算机与信息技术学院，山西太原 0300062山西大学计算智能与中文信息处理教...

如何用 Python 和 Pandas 分析犯罪记录开放数据？

玉树芝兰

03-05

1063

从开放数据中，你可以了解一个城市或者社区是否安全，并合理避险。开放3月2日，应主办方 TechMill 的邀请，我参加了在达拉斯公共图书馆举行的“达拉斯-沃斯堡开放数据日...

机器学习数据挖掘作业：基于BP神经网络、决策树、朴素贝叶斯网络的旧金山犯罪分类案例

01-21

784

机器学习数据挖掘作业：基于BP神经网络、决策树、朴素贝叶斯网络的旧金山犯罪分类案例

[python数据分析]美国波士顿犯罪数据

cecellialiu的博客

06-29

1281

import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import time from folium import Map from folium.plugins import HeatMap [/code] folium是一个地理信息可视化库，这里我用作画热力图 ## 读入数据读入数据，再查看一下每一年有...

鸢尾花python贝叶斯分类_机器学习-利用三种分类器实现鸢尾花分类

05-27

好的，你的问题是关于鸢尾花分类的Python实现，利用三种分类器实现鸢尾花分类。鸢尾花分类是机器学习中常用的分类问题之一，可以使用多种分类算法来解决。在Python中，可以使用scikit-learn库来实现鸢尾花分类。以下是三种常用的分类器实现鸢尾花分类的代码示例： 1. 贝叶斯分类器 ```python from sklearn.datasets import load_iris from sklearn.naive_bayes import GaussianNB from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载数据集 iris = load_iris() X = iris.data y = iris.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 创建贝叶斯分类器 clf = GaussianNB() # 训练模型 clf.fit(X_train, y_train) # 预测测试集 y_pred = clf.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print('Accuracy:', accuracy) ``` 2. 决策树分类器 ```python from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载数据集 iris = load_iris() X = iris.data y = iris.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 创建决策树分类器 clf = DecisionTreeClassifier() # 训练模型 clf.fit(X_train, y_train) # 预测测试集 y_pred = clf.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print('Accuracy:', accuracy) ``` 3. 支持向量机分类器 ```python from sklearn.datasets import load_iris from sklearn.svm import SVC from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # 加载数据集 iris = load_iris() X = iris.data y = iris.target # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # 创建支持向量机分类器 clf = SVC() # 训练模型 clf.fit(X_train, y_train) # 预测测试集 y_pred = clf.predict(X_test) # 计算准确率 accuracy = accuracy_score(y_test, y_pred) print('Accuracy:', accuracy) ``` 以上就是三种常用的分类器实现鸢尾花分类的Python代码示例，希望能对你有所帮助。