Измерение распределения вероятности P(z) при оценке фотометрического красного смещения галактик на основе метода случайного леса решений с квантилями
В.В.Глазкова (ВМиК МГУ), С.В.Герасимов (ВМиК МГУ), А.В.Мещеряков (ИКИ) Совершенствование методов измерения красных смещений (photo-z) внегалактических объектов на основе данных фотометрических обзоров неба имеет большое значение для задач наблюдательной космологии и эволюции галактик. Современные требования к алгоритмам photo-z использующимся при измерении эффектов слабого линзирования и БАО в крупномасштабной структуре галактик предполагают прогнозирование для каждой целевой галактики распределения плотности вероятности P(z) по красному смещению. Эмпирические методы машинного обучения в настоящее время широко применяются для измерения photo-z галактик. Сравнительный анализ существующих алгоритмов машинного обучения показал что одним из наиболее точных методов регрессии для прогнозирования красных смещений на основе признаков широкополосной фотометрии объектов из обзоров неба является метод случайного леса решений (RFDT, англ. Random Forest Decision Trees). В настоящей работе представлена модификация алгоритма RDFT, - метод случайного леса решений с квантилями, которая позволяет измерять P(z) для всех галактик целевой выборки. Предложенный метод позволяет оценивать вероятность прогнозируемых значений фотометрических красных смещений на основе объединения результатов, выданных отдельными классификаторами алгоритма RDFT, на их основе строить распределение условных вероятностей для целевой переменной (z) и оценивать вероятность прогнозируемого значения по соответствующим квантилям распределения. В докладе обсуждается, как прогнозируемая форма P(z) галактики связана с надежностью измерения photo-z. Точность предложенного метода исследовалась на тестовых выборках галактик из спектроскопических обзоров SDSS, GAMA, PRIMUS и DEEP2. Работа поддержана грантом РФФИ 14-22-03111.