自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

原创 基于python的个性化电影推荐系统

由大量的、简单的处理单元(称为神经元)广泛地互相连接而形成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学习系统。故在这样的背景下,以传统的打广告的模式来吸引观众去电影院看电影的方式在逐渐被更智能化、更具有针对性的精准推送的线上方式所取代。卷积运算的目的是提取输入的不同特征,第一层卷积层可能只能提取一些低级的特征如边缘、线条和角等层级,更多层的网路能从低级特征中迭代提取更复杂的特征。结合神经网络模型对用户的评论进行分析以此来推测用户喜欢的电影类型,并对其推荐其可能会喜欢的电影。

2022-09-18 10:15:14 3619 5

原创 基于python的统计分析

#统计建模import osprint(os.getcwd())import pandas as pdtest = pd.read_csv('D:/Titanic data/test.csv',index_col=0)print(test.head())#查看数据形状(行数和列数)test.shapeprint(test.shape)#查看数据的简要信息test.info()print(test.info())#查看列名print(test.columns)#...

2022-05-17 20:16:43 765

原创 基于python的数据可视化

import osos.getcwd()import pandas as pdtest = pd.read_csv('test.csv',index_col=0)ts=test.head()print(test.head())import seaborn as snsimport matplotlib.pyplot as plt#设置图片样式sns.set_style('darkgrid')#绘制散点图sns.stripplot(data = test,x = 'Sex'...

2022-05-17 20:14:43 505

原创 基于python的机器学习

import pandas as pd#读入数据protein = pd.read_table('test.txt',sep='\t')#查看前五排print(protein.head())#查看描述性统计分析print(protein.describe())#查看列名print(protein.columns)#查看行数和列数print(protein.shape)#数据规整化处理from sklearn import preprocessing#由于count...

2022-05-17 20:12:35 382

原创 python中英文文本情感分析

英文文本:from textblob import TextBlobdef getText(): txt = open('comment.text','r',encoding='utf-8').read() txt = txt.lower() for ch in '`~!@#$%^&*()_+-={}[];":,/<>?\|': txt = txt.replace(ch," ") return txttext = getTe

2022-05-14 16:16:53 2058 3

原创 python英文文本高频词统计

统计出现频率最高的20个词,代码:def getText(): txt = open('comment.text','r',encoding='utf-8').read() txt = txt.lower() for ch in '`~!@#$%^&*()_+-={}[];":,./<>?\|': txt = txt.replace(ch," ") return txtcommentText = getText()words

2022-05-14 16:13:33 2743

原创 python英文文本词性分析

导入需要的库from nltk.tag import pos_tagfrom nltk.tokenize import word_tokenize显示频率最高的20个单词,代码:def getText(): txt = open('comment.text','r',encoding='utf-8').read() txt = txt.lower() for ch in r'`~!\'''@#$%^&*()_+-={}[];":,./<>?\|'

2022-05-14 16:10:10 1463

原创 根据文本制作词云

根据文本comment.text和图片a4.png制作词云,注意要将文本、图片与.py代码文件放于同一文件夹下运行文本:图片:代码展示:import jieba,wordcloudimport imageiodef getText(): txt = open("comment.text","r",encoding="utf-8").read() return txt#获取文本信息并切割txt = getText()txt = jieba.lcut(t.

2022-05-14 16:06:46 483

原创 scrapy框架爬虫

#Scrapy爬虫爬虫四个步骤新建项目(scrapy startproject XXX):新建一个新的爬虫项目明确目标(编写items.py):明确你想要抓取的目标制作爬虫(sp ders/XXspider.py):制作爬虫开始爬取网页存储内容(pipelines.py):设计管道存储爬取内容#安装scrapy在terminal窗口输入以下命令pip install scrapy#新建项目scrapy startproject <项目名称>#创建爬虫文件scra.

2022-05-10 17:49:04 139

原创 大数据概率理论基础

一、数据科学的学科定位 从学科定位来看,数据科学处于数学与统计学知识

2022-05-06 15:06:49 1224

原创 python os库

import os#os库的路径操作import os.pathos.path.abspath(path)返回path在当前系统中的绝对路径>>>os.path.abspath("file.txt")'C:\\Users\\Datas\\Python\\file.txt'os.path.normpath(path)归一化path的表示形式,统一用\\分隔路径>>>os.path.normpath("D://PYE//file.txt")'D:\\P.

2022-04-28 11:14:45 2572

原创 python csv文件读取写入操作

import csv写入内容newline="" 新的一行隔行去掉encoding指定字符集编码的with open("练习.csv","w",newline="",encoding="utf-8") as f: csvweiter = csv.writer(f,dialect=("excel"))#写入数据,dialect=("excel")可写可不写,默认就是excel csvweiter.writerow(['^','#','$','%'])#写入一行 csvw.

2022-04-17 18:39:12 2016

原创 python实验三,根据文本画出词云(外加词性分析、高频词统计)

本次实验一共有三个要求,统计高频词、分析词性以及画出词云,在词性分析部分为了使结果更加直观还绘制了一个饼状图用来统计最多的十种词的占比。实验用的文本文件是实验二的爬取评论结果,为了方便便直接将实验二生成的文件拿过来使用了,在文本中有许多的非中文字符(符号、表情包、数字、字母),一开始的时候是针对这个文本专门写了一个函数除去该文本中的非中文字符,再将结果存入一个新的文本“实验文本”,此后的操作便一直使用这个文本进行,但是在做完之后觉得只能局限性太大了,于是便上网查询了一下,知道了可以用正则表达式来解决这个问题

2022-04-17 15:02:45 3156 1

原创 python jieba库

jeiba是优秀的中文分词第三分库jieba分词有三种模式:精确模式,全模式,搜索引擎模式精确模式:将文本精确切分开,不存在冗余单词全模式:把文本多有可能的词语都扫描出来,有冗余搜索引擎模式:在精确模式基础上,对长词进行再次切分jieba.lcut(s):精确模式,返回一个列表类型的分词结果 #重点记忆>>>jieba,lcut("中国是一个伟大的国家")['中国','是','一个','伟大','的','国家']jieba.lcut(s,cut_all = T.

2022-04-11 20:08:40 959

原创 python wordcloud库

import wordcloud,jiebaw = wordcloud.WordCloud()#生成一个词云对象ww.generate(txt):向WordCloud对象w中加载文本txt>>>w.generate("Python and WordCloud")w.to_file(filename):将词云输出为图像文件,.png或.jpg格式>>>w.to_file("outfile.png")步骤配置对象参数加载词云文本输出词云文件c =.

2022-04-11 20:06:30 591

原创 python 文件操作,寻找车辆(切片解决)

程序设计题 寻找车辆‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬描述‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬a.car_data.txt”文件是以英文逗号分隔的数据文本文件,以gbk编码格式...

2022-04-03 19:45:22 4869

原创 python re正则表达式

import re# text = '身高:178, 体重:164, 学号:123456, 密码:9527'# text = '我的电话是18482547646,我还有一个号码是15382853828,我喜欢的数字是8888888888,我的座机号是0818-12345678'# text = '18482547646,我还有一个号码是15382853828,我喜欢的数字是8888888888,我的座机号是0818-12345678'# text = 'barbar carcar harhel'.

2022-04-03 19:38:46 649

原创 python numpy库基本函数

import numpy as nparray = np.array([1,2,3,4])#定义一维矩阵array = np.array([[1,2,3], [2,3,4]])#定义二维矩阵print(array)print('number of dim:',array.ndim)#几维数组print('shape',array.shape)#几行几列print('size',array.size)#一共有几个元素a = np.array([2,2,3.

2022-04-01 21:14:35 316

原创 python math库基本函数

math.pi --3.145926......math.e --2.72......math.ceil(x) --对x向上取整math.floor(x) --对x向下取值整math.pow(x,y) --x的y次幂math.log(x) --自然对数math.Log10(x) --常用对数math.squrt(x) --x的算术平方根math.exp(x) --x的e次幂math.degrees(.

2022-04-01 20:54:16 2974

原创 python蒙德卡罗方法求曲线y=x*x与x轴在[0,1]面积

使用蒙特卡洛法求出曲线y=x*x与x轴之间在0-1范围内的面积‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬种子数为10‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬使用100000个点进行计算‪‬‪‬‪‬‪‬‪

2022-03-26 11:02:19 3100 2

原创 python哥德巴赫猜想

哥德巴赫1742年给欧拉的信中哥德巴赫提出了以下猜想:任一大于2的偶数都可写成两个素数之和。请输出6-20之间所有偶数的所有拆分结果。输入输出示例 输入 输出 示例 1 无 6=3+3 8=3+5 8=5+3 10=3+7 10=5+5 10=7+3 12=5+7 12=7+5 14=3+11 14=7+7 14=11+3 16=3+13 16=5+11 16=11+5 16=13+3

2022-03-26 10:47:34 8020 6

原创 python turtle库一些基本函数

# turtle.setup(width,height,startx,starty)设置生成窗体的宽,高,位置# 若没有对startx,starty赋值,则默认为在屏幕中间# turtle.goto(x,y)从上一点绘制直线到指定坐标# turtle.fd():从正前方运行# turtle.bk():反方向运行# turtle.circle(x,y):以左侧某一点为圆心做曲线运动# turtle.seth(angle),别名turtle.setheading(angle):改变行进方.

2022-03-26 10:41:35 3167

原创 Python蒙德卡罗方法求PI

import randomm = 1000000#使用1000000个点进行计算n = 0.0#计数落在圆中的点for i in range(1,m+1): x,y = random.random(),random.random() dist = pow(x ** 2 + y ** 2,0.5) if dist <= 1.0: n = n+1pi = 4*(n/m)print("圆周率值是:{:.2f}".format(pi))

2022-03-24 15:38:48 2551

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除