- 博客(15)
- 收藏
- 关注
原创 基于大数据技术的个性化电影推荐系统
基于大数据技术的个性化电影推荐系统是一项利用大数据分析和机器学习算法为用户提供个性化电影推荐的系统。该系统将收集并分析用户的电影观看历史、评分偏好、社交网络信息等多维度数据,通过算法对用户进行建模,并根据用户的兴趣和个性化需求,推荐用户可能感兴趣的电影。
2023-12-23 13:36:21 3343 14
原创 爬虫采集:数据提取
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式,它使得人们很容易的进行阅读和编写。1. 利用etree.HTML,将字符串转化为Element对象,Element对象具有xpath的方法,返回结果的列表,能够接受bytes类型的数据和str类型的数据。Beautiful Soup 也是一个HTML/XML的解析器,主要的功能也是如何解析和提取 HTML/XML 数据。json.load:类文件对象中的json字符串转化为python类型。
2024-04-22 10:00:00 1282 2
原创 爬虫基本知识
请求,由客户端向服务端发出,可以分为 4 部分内容:请求方法(Request Method)、请求的网址 (Request URL)、请求头(Request Headers)、请求体(Request Body)。网络爬虫(又被称为网页蜘蛛,网络机器人)就是模拟浏览器发送网络请求,接收请求响应,一种按照一定的规则,自动地抓取互联网信息的程序。请求体一般承载的内容是 POST 请求中的表单数据,而对于 GET 请求,请求体则为空。请求的网址,即统一资源定位符 URL,它可以唯一确定我们想请求的资源。
2024-04-21 10:00:00 1127 3
原创 Python 操作 Redis MongoDB
inser_many :插入多条数据 数据类型为[{},{},{},{}]方法删除键值对,如果删除成功则返回受影响的键的数量,否则返回0。insert_one : 插入一条数据 数据类型为{}格式。返回的都是一个游标对象,需要对游标对象进行列表类型转换。方法进行修改,如果键存在则进行修改,否则创建新数据。方法获取数据,如果键存在返回对应的值,否则返回。update_many:更新全部数据。方法添加键值对,如果添加成功返回。方法获取键,可以使用正则表达式。find_one:查询一条数据。
2024-02-02 10:00:00 393
原创 Redis 数据库
本文对reids的数据类型 字符串(String)、哈希(Hash)、列表(List)、集合(Set)和有序集合(Sorted Set)进行了描述。
2024-02-01 10:00:00 985 1
原创 查询优化 - 索引
如果指定字段是字符串,需要指定长度,建议长度与定义字段时的长度一致。使用python程序(ipython也可以)通过。字段类型如果不是字符串,可以不填写长度部分。模块 向表中加入十万条数据。
2023-12-28 22:15:48 456 1
原创 MySQL数据库-基础
MySQL 是一种常见的关系型数据库管理系统(RDBMS),它由 MySQL AB 公司开发,现已被 Oracle 公司收购。MySQL 被广泛用于开发 Web 应用程序和其他类型的软件,如电子商务、社交网络、金融服务等。MySQL 具有可扩展性、高性能、可靠性等特点,因此受到了广泛的欢迎和应用。除了作为一个独立的数据库管理系统之外,MySQL 还可以与多种编程语言和开发框架进行集成,如 PHP、Java 和 Ruby 等,提供了丰富的数据访问和操作功能。
2023-12-24 09:00:00 967 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人