Главная страница

Материалы докладов

Обсуждение докладов

Виртуальные доклады



English
 

Трансдуктивное построение линейно отделимого класса по его среднему значению:
теоретическая основа и алгоритм



Бауман Евгений Викторович (Russian School of Mathematics, New York, USA),

Бауман Константин Евгеньевич (Fox School of Business, Temple University, Philadelphia, USA)



Аннотация:

Стандартный подход к проблеме классификации в машинном обучении основывается на предположении, что классы линейно отделимы в рассматриваемом пространстве признаков. В данной работе мы применяем этот подход к случаю трансдуктивного частичного обучения, целью которого является определение правильных меток для тестового множества немаркированных данных. В частности, мы доказываем новый фундаментальный факт, что линейно отделимый класс можно однозначно идентифицировать по его среднему значению. Мы доказали, что класс линейно отделим тогда и только тогда, когда его вероятность максимальна среди всех множеств с совпадающим средним значением. Также мы показываем, что для любой точки пространства признаков, которая является средним некоторого множества, существует единственный линейно отделимый класс с центром в этой точке. Наконец, мы доказали непрерывность отображения возможных средних в соответствующие линейно отделимые классы. Мы используем это теоретическое обоснование для разработки Алгоритма MPSM (Maximal by Probability with the Same Mean, Максимальный по вероятности с одинаковым средним) для трансдуктивного частичного обучения линейно отделимого класса на основе значения его среднего. Мы также предлагаем модификацию нашего алгоритма (OC-MPSM) для задачи одноклассового трансдуктивного частичного обучения. Мы тестируем наш подход на основе набора данных изображений цифр USPS. Наши результаты показывают, что предложенные теория и метод работают хорошо и подтверждают, что класс может быть успешно идентифицирован на основе знания его среднего значения. Наш анализ показал особенное преимущество OC-MPSM над базовыми моделями в случаях, когда обучающая выборка содержит мало элементов.



Видеозапись в формате mp4


Презентация доклада: