Sorry, your browser cannot access this site
This page requires browser support (enable) JavaScript
Learn more >

MengFanjun的博客

视频教程:【莫烦Python】Scikit-learn (sklearn) 优雅地学会机器学习

在第一篇中,我们采用了鸢尾花的数据集进行了测试,这次我们采用boston的数据集进行测试,boston也是sklearn自带的数据库

程序示例:

1
2
3
4
5
6
7
8
9
10
11
12
from sklearn import datasets##导入datasets
from sklearn.linear_model import LinearRegression##导入线性回归模型

loaded_data=datasets.load_boston()##加载boston数据
data_X=loaded_data.data##数据值
data_y=loaded_data.target##目标值

modele=LinearRegression()##用线性回归模型
modele.fit(data_X,data_y)##data_X是训练数据输入,data_y是训练数据输出

print(modele.predict(data_X[:4,:]))##对前四个数据进行预测
print(data_y[:4])##前四个数据实际值,形成对比,观察其预测的准确度

输出结果:

1
2
[30.00384338 25.02556238 30.56759672 28.60703649]##预测值
[24. 21.6 34.7 33.4]##实际值

可以看到,预测的结果并没有那么准确,因为我们并没有将对模型进行改善,所以作为入门学习,采用sklearn默认的模型就足够了

接下来我们创造一些数据,赋值给X,y 程序示例:

1
2
3
4
5
6
7
from sklearn import datasets##导入datasets
from sklearn.linear_model import LinearRegression##导入线性回归模型
import matplotlib.pyplot as plt##使用图像化工具

X,y=datasets.make_regression(n_samples=100,n_features=1,n_targets=1,noise=1)##创造100个例子,1个特征值,1个回归目标,1noise
plt.scatter(X,y)##画图
plt.show()##展示出画图的结果

输出结果: 请添加图片描述

若noise变大,noise=10,离散会更大 noise=10的输出结果: 请添加图片描述 运用我们创造出的数据进行机器学习,可以让我们更有目的性的去进行训练

评论