Главная страница
Материалы докладов
Обсуждение докладов
Виртуальные доклады
English
|
|
Трансдуктивное построение линейно отделимого класса по его среднему значению: теоретическая основа и алгоритм
Бауман Евгений Викторович (Russian School of Mathematics, New York, USA),
Бауман Константин Евгеньевич (Fox School of Business, Temple University, Philadelphia, USA)
Аннотация:
Стандартный подход к проблеме классификации в машинном обучении основывается на предположении, что классы линейно отделимы в рассматриваемом пространстве признаков.
В данной работе мы применяем этот подход к случаю трансдуктивного частичного обучения, целью которого является определение правильных меток для тестового множества немаркированных данных.
В частности, мы доказываем новый фундаментальный факт, что линейно отделимый класс можно однозначно идентифицировать по его среднему значению. Мы доказали, что класс линейно отделим
тогда и только тогда, когда его вероятность максимальна среди всех множеств с совпадающим средним значением. Также мы показываем, что для любой точки пространства признаков,
которая является средним некоторого множества, существует единственный линейно отделимый класс с центром в этой точке. Наконец, мы доказали непрерывность отображения возможных средних
в соответствующие линейно отделимые классы. Мы используем это теоретическое обоснование для разработки Алгоритма MPSM (Maximal by Probability with the Same Mean,
Максимальный по вероятности с одинаковым средним) для трансдуктивного частичного обучения линейно отделимого класса на основе значения его среднего. Мы также предлагаем модификацию
нашего алгоритма (OC-MPSM) для задачи одноклассового трансдуктивного частичного обучения. Мы тестируем наш подход на основе набора данных изображений цифр USPS.
Наши результаты показывают, что предложенные теория и метод работают хорошо и подтверждают, что класс может быть успешно идентифицирован на основе знания его среднего значения.
Наш анализ показал особенное преимущество OC-MPSM над базовыми моделями в случаях, когда обучающая выборка содержит мало элементов.
Видеозапись в формате mp4
Презентация доклада:
|