2019蓝桥杯.zip
2019年蓝桥杯B组省赛C/C++试题,包括PDF文件、A-J题全部试题的图片、数据等。试题解析可以参考:https://blog.csdn.net/zhaohaibo_/article/details/88783978
调用sklearn库的K-Means聚类分析实例
#class sklearn.cluster.KMeans(n_clusters=8, init=’k-means++’, n_init=10, max_iter=300, tol=0.0001, precompute_distances=’auto’, verbose=0, random_state=None, copy_x=True, n_jobs=1, algorithm=’auto’)
#参数:
#(1)对于K均值聚类,我们需要给定类别的个数n_cluster,默认值为8;
#(2)max_iter为迭代的次数,这里设置最大迭代次数为300;
#(3)n_init设为10意味着进行10次随机初始化,选择效果最好的一种来作为模型;
#(4)init=’k-means++’ 会由程序自动寻找合适的n_clusters;
#(5)tol:float形,默认值= 1e-4,与inertia结合来确定收敛条件;
#(6)n_jobs:指定计算所用的进程数;
#(7)verbose 参数设定打印求解过程的程度,值越大,细节打印越多;
#(8)copy_x:布尔型,默认值=True。当我们precomputing distances时,将数据中心化会得到更准确的结果。如果把此参数值设为True,则原始数据不会被改变。如果是False,则会直接在原始数据上做修改并在函数返回值时将其还原。但是在计算过程中由于有对数据均值的加减运算,所以数据返回后,原始数据和计算前可能会有细小差别。
#属性:
#(1)cluster_centers_:向量,[n_clusters, n_features]
# Coordinates of cluster centers (每个簇中心的坐标??);
#(2)Labels_:每个点的分类;
#(3)inertia_:float,每个点到其簇的质心的距离之和。
python爬取淘宝商品信息
import requests
from bs4 import BeautifulSoup
import bs4
def getHTMLText(url):
try:
r = requests.get(url, timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""
def fillUnivList(ulist, html):
soup = BeautifulSoup(html, "html.parser")
for a in soup.find('tbody').children:
if isinstance(a, bs4.element.Tag):
tds = a('td')
ulist.append([tds[0].string, tds[1].string, tds[2].string, tds[3].string])
def printUnivList(ulist, num):
print("{:^10}\t{:^6}\t{:^6}\t{:^16}".format("排名","学校名称","地区","总分"))
for i in range(num):
u=ulist[i]
print("{:^10}\t{:^6}\t{:^6}\t{:^16}".format(u[0],u[1],u[2],u[3]))