Алгоритм, основанный на использовании метрики Хэмминга, строит дерево решений, используя обучающую выборку. Какое из четырёх утверждений верны? Это дерево решений: В корне дерева находится наиболее близкий к решающему атрибуту признак. Обязательн...
Алгоритм, основанный на использовании метрики Хэмминга, строит дерево решений, используя обучающую выборку. Какое из четырёх утверждений верны? Это дерево решений:
В корне дерева находится наиболее близкий к решающему атрибуту признак.
Обязательно будет бинарным.
Каждый путь от корня дерева к листу не содержит повторных проверок уже использованных атрибутов.
Конечные вершины дерева (листья) могут быть взвешены именами более чем двух классов.
Для того чтобы ответить на вопрос, давайте рассмотрим каждое из утверждений по отдельности: 1. **В корне дерева находится наиболее близкий к решающему атрибуту признак.** Это утверждение не совсем корректно. В дереве решений выбор атрибута для корня обычно основан на максимизации информации, полученной от разделения данных. Это может быть основано на различных критериях, таких как энтропия или индекс Джини, но не обязательно на метрике Хэмминга. Метрика Хэмминга измеряет количество позиций, в которых два вектора различаются, и не используется напрямую для выбора атрибута в корне. 2. **Обязательно будет бинарным.** Это утверждение неверно. Дерево решений может быть как бинарным, так и многозначным. В бинарном дереве каждый узел имеет два дочерних узла, но дерево решений может иметь узлы с несколькими дочерними узлами, если атрибут имеет более двух значений. 3. **Каждый путь от корня дерева к листу не содержит повторных проверок уже использованных атрибутов.** Это утверждение верно. В дереве решений каждый атрибут обычно используется только один раз на пути от корня к листу. Это связано с тем, что повторная проверка одного и того же атрибута не добавляет новой информации для принятия решения. 4. **Конечные вершины дерева (листья) могут быть взвешены именами более чем двух классов.** Это утверждение верно. Дерево решений может классифицировать данные на более чем два класса, поэтому листья могут представлять собой различные классы, не ограничиваясь только двумя. Таким образом, верными являются утверждения 3 и 4.