- 博客(21)
- 资源 (5)
- 收藏
- 关注
原创 python统计文本词频
import jiebafrom collections import Counterdata_ = jieba.cut(text)data = dict(Counter(data_))data2 = sorted(data.items(), key=lambda x: x[1], reverse=True)data2[:10]
2018-02-27 16:40:51 5487
原创 python提取文本关键字
import jieba.analysekwords = jieba.analyse.extract_tags(text, 200)
2018-02-27 16:39:07 5969
原创 python提取文本关键字
import jieba.analysekwords = jieba.analyse.extract_tags(text, 200)
2018-02-27 16:38:47 6572
原创 python指定文件编码格式
res = ['a', 'b', 'c', 'd']with open('职位名称.csv', 'w+', encoding='utf-8') as f: for i in res: f.write(i + '\n')
2018-02-27 14:29:11 1808
原创 python操作MongoDB数据库
from pymongo import MongoClientconn = MongoClient('127.0.0.1', 27017)db = conn.zhilian1my_set = db.table0res = my_set.distinct('职位名称')cursor = my_set.find()print(cursor.next())
2018-02-27 14:26:22 134
原创 MongoDB导入导出数据库
导出mongoexport -d zhilian1 -c table0 -o d:/table.json --type jsonmongoexport -d zhilian1 -c table0 -o d:/table.csv --type csv -f 职位类别, 职位月薪mongoexport -d dbname -c collectionname -o file --type ...
2018-02-26 18:38:40 202
原创 MongoDB启动
mongod --dbpath d:/data/db dbpath后面跟数据库的存储路径启动成功后,输入mongo即可进入mongo控制台
2018-02-24 12:59:44 208
原创 Matlab做分布拟合及绘制频率分布直方图
clcclearclose allx = randn(1000, 1);% 画频率分布直方图[counts,centers] = hist(x, 7);figurebar(centers, counts / sum(counts))% 分布参数拟合[mu,sigma]=normfit(x);% 画已知分布的概率密度曲线x1 = -4:0.1:4;y1 = pdf('...
2018-02-24 12:27:47 65126 3
原创 Python之装饰器
装饰器就是一个以函数作为参数并返回一个替换函数的可执行函数 即装饰器是一个函数,其参数为函数,返回值也为函数 可理解为对函数的功能进行拓展,所以叫装饰# outer为装饰器,效果为给被装饰函数返回值结果加负号def outer(fun): def inner(x): return -fun(x) return innerde...
2018-02-21 20:02:13 136
原创 Python函数之*args与**kwargs
函数定义中参数前的*表示的是将调用时的多个参数放入元组中,**则表示将调用函数时的关键字参数放入一个字典中def one(*args): print(args) print((type(args)))one(1, 2, 3, 'a')# (1, 2, 3, 'a')# <class 'tuple'>def two(**kwargs): print...
2018-02-21 19:45:51 146
原创 numpy之array展开
flatten()可以将二维的array展成一维的 a.flatten(order=’C’) Return a copy of the array collapsed into one dimension. order= 'C' means to flatten in row-major (C-style) order. order='F' means to flat...
2018-02-21 18:44:01 12624
原创 numpy之matrix和array的乘法区别
matrix和array的乘法有所区别1、arrayA * A是对应元素相乘,np.dot(A, A)是矩阵乘法2、matrixA * A是矩阵乘法,np.multiply(A, A)是对应元素相乘具体参考这篇博文[numpy]matrix和array的乘和加...
2018-02-21 15:00:33 706
原创 Python函数之map、reduce、filter
map map(func, *iterables) –> map objectseq1 = [1, 2, 3, 4]seq2 = [5, 6, 7, 8]m1 = map(lambda x: x ** 2, seq1)print(list(m1))# [1, 4, 9, 16]m2 = map(lambda x, y: x + y, seq1, seq2)pri...
2018-02-21 13:57:18 166
原创 Python字典常见函数
items()keys()values()get()pop()popitem()update()setdefault() D.items() -> a set-like object providing a view on D’s items D.get(k[,d]) -> D[k] if k in D, else d. d defaults ...
2018-02-21 13:27:16 262
原创 Python字典排序
x = { 'a': 1, 'b': 2, 'c': 5, 'd': 3}sorted(d.items(), key=lambda x: x[1])# [('a', 1), ('b', 2), ('d', 3), ('c', 5)]
2018-02-21 13:07:18 184
原创 numpy数组排序
获取最大最小值索引argsort(), 返回一个array, 其第i个位置的值为: 原数组从小到大排序,排第i个位置的值的索引import numpy as npx = np.array([1, 7, 3, 5, 2])x.argmax()# 1x.argmin()# 0index = x.argsort() # array([0, 4, 2, 3, 1], dtyp...
2018-02-20 22:27:20 1827
原创 将数据集分为训练集和测试集
在获得数据集后,我们需要将数据集分为训练集和测试集,分别进行模型的训练和对模型进行评估,sklearn提供了train_test_split来分割训练集和测试集from sklearn.model_selection import train_test_splitX_train, X_test, y_train, y_test = train_test_split(X, y, test_s...
2018-02-20 21:13:53 15252 2
原创 读取sklearn中的数据集
在学习机器学习的时候,我们经常需要数据集来对算法的效果进行验证,sklearn库提供了部分数据集,我们可以很方便地使用from sklearn.datasets import load_digitsdigits = load_digits()dir(digits)# ['DESCR', 'data', 'images', 'target', 'target_names']data =...
2018-02-20 21:06:52 2556
原创 python读取mat文件
mat为Matlab保存数据的格式,使用python的scipy包也可以进行读取import scipy.io as siodef load_data(path): data_ = sio.loadmat(path) data = data_['data'] labels = data_['labels'].flatten() return data, la...
2018-02-20 20:27:11 1917
原创 plt绘图与Axes绘图
使用matplotlib.pyplot(plt)进行绘图时,有两种方法:直接使用plt里的函数使用面向对象的方法,先产生一个Axes对象,再对此对象进行操作,实现绘图第二种方法可以实现更多操作,具有更好的定制性使用plt绘图import numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans...
2018-02-20 15:39:18 10591 1
原创 Matplotlib及Seaborn中文显示问题
在使用matplotlib及seaborn时,中文无法正常显示,显示结果为一个方框,解决方法:Matplotlibimport numpy as npimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['SimHei'] # 解决中文显示问题-设置字体为黑体plt.rcParams['axes.u...
2018-02-20 15:27:52 20468 3
信息安全RSA算法实验.rar
2019-11-13
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人