Какое из утверждений верно?
Наиболее простой способ оценить, насколько хорошо построенная решающая функция (такая, как система решающих правил, или дерево решений) работает - это проверить её на тестовом множестве (экзамен).
В качестве экзаменационного множества при этом используется:
Другие предметы Колледж Оценка качества моделей машинного обучения интеллектуальные информационные системы колледж решающая функция тестовое множество экзамен обучающая выборка классификация дерево решений оценка эффективности системы решающих правил Новый
Чтобы ответить на вопрос, давайте разберем каждое из предложенных утверждений относительно тестового множества и его роли в оценке качества решающей функции.
1. Обучающая выборка, из которой удалены те примеры, для которых классификация была ошибочна.
Это утверждение неверно. Если мы удалим из обучающей выборки примеры, которые классифицировались ошибочно, мы получим искаженное представление о модели. Она может показаться лучше, чем есть на самом деле, поскольку мы не тестируем её на всех данных.
2. Обучающая выборка, к которой добавлены несколько новых примеров.
Это тоже не является правильным подходом. Добавление новых примеров к обучающей выборке не дает возможности оценить, как модель будет работать на данных, которые она не видела ранее. Это может привести к переобучению.
3. Множество примеров, ни один из которых не входил в исходную обучающую выборку.
Это утверждение верно. Тестирование модели на независимом тестовом множестве, которое не пересекается с обучающей выборкой, позволяет получить реальную оценку её производительности. Это помогает понять, насколько хорошо модель обобщает информацию и справляется с новыми данными.
4. Обучающая выборка полностью.
Это также неверно. Использование всей обучающей выборки для тестирования модели не даст объективной оценки её качества, так как модель уже "знает" эти данные и может выдавать высокие результаты, даже если она не будет хорошо работать на новых данных.
В итоге, правильным ответом является третье утверждение: Множество примеров, ни один из которых не входил в исходную обучающую выборку. Это позволяет получить наиболее точную оценку качества работы модели.