厌缘-CSDN博客

原创基于python的个性化电影推荐系统

由大量的、简单的处理单元（称为神经元）广泛地互相连接而形成的复杂网络系统，它反映了人脑功能的许多基本特征，是一个高度复杂的非线性动力学习系统。故在这样的背景下,以传统的打广告的模式来吸引观众去电影院看电影的方式在逐渐被更智能化、更具有针对性的精准推送的线上方式所取代。卷积运算的目的是提取输入的不同特征，第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级，更多层的网路能从低级特征中迭代提取更复杂的特征。结合神经网络模型对用户的评论进行分析以此来推测用户喜欢的电影类型，并对其推荐其可能会喜欢的电影。

2022-09-18 10:15:14 4472 5

原创基于python的统计分析

#统计建模import osprint(os.getcwd())import pandas as pdtest = pd.read_csv('D:/Titanic data/test.csv',index_col=0)print(test.head())#查看数据形状（行数和列数）test.shapeprint(test.shape)#查看数据的简要信息test.info()print(test.info())#查看列名print(test.columns)#...

2022-05-17 20:16:43 886

原创基于python的数据可视化

import osos.getcwd()import pandas as pdtest = pd.read_csv('test.csv',index_col=0)ts=test.head()print(test.head())import seaborn as snsimport matplotlib.pyplot as plt#设置图片样式sns.set_style('darkgrid')#绘制散点图sns.stripplot(data = test,x = 'Sex'...

2022-05-17 20:14:43 591

原创基于python的机器学习

import pandas as pd#读入数据protein = pd.read_table('test.txt',sep='\t')#查看前五排print(protein.head())#查看描述性统计分析print(protein.describe())#查看列名print(protein.columns)#查看行数和列数print(protein.shape)#数据规整化处理from sklearn import preprocessing#由于count...

2022-05-17 20:12:35 543

原创 python中英文文本情感分析

英文文本：from textblob import TextBlobdef getText(): txt = open('comment.text','r',encoding='utf-8').read() txt = txt.lower() for ch in '`~!@#$%^&*()_+-={}[];":,/<>?\|': txt = txt.replace(ch," ") return txttext = getTe

2022-05-14 16:16:53 2362 3

原创 python英文文本高频词统计

统计出现频率最高的20个词，代码：def getText(): txt = open('comment.text','r',encoding='utf-8').read() txt = txt.lower() for ch in '`~!@#$%^&*()_+-={}[];":,./<>?\|': txt = txt.replace(ch," ") return txtcommentText = getText()words

2022-05-14 16:13:33 3077

原创 python英文文本词性分析

导入需要的库from nltk.tag import pos_tagfrom nltk.tokenize import word_tokenize显示频率最高的20个单词，代码：def getText(): txt = open('comment.text','r',encoding='utf-8').read() txt = txt.lower() for ch in r'`~!\'''@#$%^&*()_+-={}[];":,./<>?\|'

2022-05-14 16:10:10 1633

原创根据文本制作词云

根据文本comment.text和图片a4.png制作词云，注意要将文本、图片与.py代码文件放于同一文件夹下运行文本：图片：代码展示：import jieba,wordcloudimport imageiodef getText(): txt = open("comment.text","r",encoding="utf-8").read() return txt#获取文本信息并切割txt = getText()txt = jieba.lcut(t.

2022-05-14 16:06:46 554

原创 scrapy框架爬虫

#Scrapy爬虫爬虫四个步骤新建项目（scrapy startproject XXX）:新建一个新的爬虫项目明确目标（编写items.py）:明确你想要抓取的目标制作爬虫（sp ders/XXspider.py）:制作爬虫开始爬取网页存储内容（pipelines.py）:设计管道存储爬取内容#安装scrapy在terminal窗口输入以下命令pip install scrapy#新建项目scrapy startproject <项目名称>#创建爬虫文件scra.

2022-05-10 17:49:04 196

原创大数据概率理论基础

一、数据科学的学科定位从学科定位来看，数据科学处于数学与统计学知识

2022-05-06 15:06:49 1441

原创 python os库

import os#os库的路径操作import os.pathos.path.abspath(path)返回path在当前系统中的绝对路径>>>os.path.abspath("file.txt")'C:\\Users\\Datas\\Python\\file.txt'os.path.normpath(path)归一化path的表示形式，统一用\\分隔路径>>>os.path.normpath("D://PYE//file.txt")'D:\\P.

2022-04-28 11:14:45 2676

原创 python csv文件读取写入操作

import csv写入内容newline="" 新的一行隔行去掉encoding指定字符集编码的with open("练习.csv","w",newline="",encoding="utf-8") as f: csvweiter = csv.writer(f,dialect=("excel"))#写入数据,dialect=("excel")可写可不写，默认就是excel csvweiter.writerow(['^','#','$','%'])#写入一行 csvw.

2022-04-17 18:39:12 2191

原创 python实验三，根据文本画出词云（外加词性分析、高频词统计）

本次实验一共有三个要求，统计高频词、分析词性以及画出词云，在词性分析部分为了使结果更加直观还绘制了一个饼状图用来统计最多的十种词的占比。实验用的文本文件是实验二的爬取评论结果，为了方便便直接将实验二生成的文件拿过来使用了，在文本中有许多的非中文字符（符号、表情包、数字、字母），一开始的时候是针对这个文本专门写了一个函数除去该文本中的非中文字符，再将结果存入一个新的文本“实验文本”，此后的操作便一直使用这个文本进行，但是在做完之后觉得只能局限性太大了，于是便上网查询了一下，知道了可以用正则表达式来解决这个问题

2022-04-17 15:02:45 3492 1

原创 python jieba库

jeiba是优秀的中文分词第三分库jieba分词有三种模式：精确模式，全模式，搜索引擎模式精确模式：将文本精确切分开，不存在冗余单词全模式：把文本多有可能的词语都扫描出来，有冗余搜索引擎模式：在精确模式基础上，对长词进行再次切分jieba.lcut(s):精确模式，返回一个列表类型的分词结果 #重点记忆>>>jieba,lcut("中国是一个伟大的国家")['中国','是','一个','伟大','的','国家']jieba.lcut(s,cut_all = T.

2022-04-11 20:08:40 1098

原创 python wordcloud库

import wordcloud,jiebaw = wordcloud.WordCloud()#生成一个词云对象ww.generate(txt):向WordCloud对象w中加载文本txt>>>w.generate("Python and WordCloud")w.to_file(filename):将词云输出为图像文件,.png或.jpg格式>>>w.to_file("outfile.png")步骤配置对象参数加载词云文本输出词云文件c =.

2022-04-11 20:06:30 764

原创 python 文件操作，寻找车辆(切片解决)

程序设计题寻找车辆‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬描述‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬a.car_data.txt”文件是以英文逗号分隔的数据文本文件,以gbk编码格式...

2022-04-03 19:45:22 5109

原创 python re正则表达式

import re# text = '身高:178, 体重:164, 学号:123456, 密码:9527'# text = '我的电话是18482547646，我还有一个号码是15382853828，我喜欢的数字是8888888888，我的座机号是0818-12345678'# text = '18482547646，我还有一个号码是15382853828，我喜欢的数字是8888888888，我的座机号是0818-12345678'# text = 'barbar carcar harhel'.

2022-04-03 19:38:46 713

原创 python numpy库基本函数

import numpy as nparray = np.array([1,2,3,4])#定义一维矩阵array = np.array([[1,2,3], [2,3,4]])#定义二维矩阵print(array)print('number of dim:',array.ndim)#几维数组print('shape',array.shape)#几行几列print('size',array.size)#一共有几个元素a = np.array([2,2,3.

2022-04-01 21:14:35 391

原创 python math库基本函数

math.pi --3.145926......math.e --2.72......math.ceil(x) --对x向上取整math.floor(x) --对x向下取值整math.pow(x,y) --x的y次幂math.log(x) --自然对数math.Log10(x) --常用对数math.squrt(x) --x的算术平方根math.exp(x) --x的e次幂math.degrees(.

2022-04-01 20:54:16 3120

原创 python蒙德卡罗方法求曲线y=x*x与x轴在[0,1]面积

使用蒙特卡洛法求出曲线y=x*x与x轴之间在0-1范围内的面积‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬种子数为10‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬使用100000个点进行计算‪‬‪‬‪‬‪‬‪

2022-03-26 11:02:19 3282 2

m0_55679583的博客