В алгоритмах машинного обучения множество, которое используется для обучения, называется обучающим набором данных. Давайте рассмотрим возможные варианты:
-
Бесконечное число примеров: На практике невозможно использовать бесконечное число примеров для обучения, поскольку хранение и обработка бесконечного количества данных физически невозможны. Алгоритмы машинного обучения работают с конечными ресурсами, такими как память и время, поэтому обучающее множество всегда будет конечным.
-
Бесконечное, но обязательно счётное число примеров: Это теоретически возможно, если мы говорим о потенциально бесконечном потоке данных, например, в случае непрерывного сбора данных, как в потоковой обработке. Однако на практике, в любой момент времени, набор данных будет конечным, так как мы имеем дело с ограниченным количеством данных, которые были собраны до текущего момента.
-
Счётное число примеров: Это более реалистичный вариант, который подразумевает, что данные могут быть потенциально бесконечными, но в каждый момент времени мы имеем дело с конечным количеством примеров. Это соответствует ситуации, когда данные поступают постепенно, как в случае онлайн-обучения.
-
Конечное число примеров: Это самый распространенный случай в практике машинного обучения. Обычно мы имеем дело с заранее собранным набором данных, который имеет фиксированное количество примеров. Такие наборы данных используются для обучения моделей и оценки их производительности.
Таким образом, на практике обучающее множество данных в алгоритмах машинного обучения содержит конечное число примеров, поскольку это единственный вариант, который реально осуществим с точки зрения хранения и обработки данных.