机器学习系列------决策函数

alltolove · 发表于 2018-6-14 09:51:09

您需要登录才可以下载或查看，没有账号？立即注册

x

新启一个文件，首先把以前的代码复制过来：

复制代码

建立决策函数，决策函数是通过调试阀值帮助我们预测精准度的一个工具：

复制代码

会显示：array([ 66994.58438748])，这个数是预测准确的一个分数，但是必须要有一个阀值来判断边界：

复制代码

以上我们把阀值设定为0，他会显示：array([ True], dtype=bool)。因为我们这个分数已经超过了阀值，就说明预测结果是对的，但是阀值又通过什么来确定呢，我们把阀值设定高点试试：

复制代码

显示：array([False], dtype=bool)。就说明阀值一定要取的正合适才行，就要通过准确率召回曲线确定阀值：

from sklearn.model_selection import cross_val_predict
y_scores=cross_val_predict(sgd_clf,X_train,y_train_5,cv=3,method="decision_function")
from sklearn.metrics import precision_recall_curve
precisions,recalls,thresholds=precision_recall_curve(y_train_5,y_scores[:,1])

复制代码

然后我们写个画图功能的函数：

复制代码

调用画图函数：

复制代码

输出的图像为：

从上图可以得出准确度追高的时候在50000左右，我们可以看一下决策函数大于50000时的评分：

复制代码

显示结果为：0.90712074303405577

复制代码

0.54049068437557646

账号		自动登录	找回密码
密码			立即注册

[技术交流] 机器学习系列------决策函数