модель определяющая фишинговые электронные письма

28.05.2026

Просмотры: 3

Краткое описание

Краткое описание работы

Тема: Разработка и валидация модели машинного обучения для детекции фишинговых электронных писем на основе анализа текстового содержания и метаданных.

Актуальность. В условиях экспоненциального роста объёмов электронной переписки и усложнения методов социальной инженерии, фишинг остаётся одной из наиболее опасных угроз информационной безопасности. Традиционные сигнатурные методы и спам-фильтры демонстрируют снижение эффективности при противодействии целевым (spear-phishing) атакам, что требует внедрения интеллектуальных систем на базе машинного обучения.

Цель работы. Повышение точности и скорости выявления фишинговых сообщений путем создания и обучения классификационной модели, способной различать легитимные и вредоносные письма на основе синтаксического, семантического и метаданных анализа.

Объект исследования. Процесс коммуникации в корпоративных и публичных почтовых системах, включающий поток входящих электронных писем.

Предмет исследования. Статистические, лингвистические и структурные признаки фишинговых писем, а также алгоритмы машинного обучения (например, градиентный бустинг, ансамбли нейронных сетей) для их классификации.

Задачи:
1. Провести анализ современных методов фишинга и существующих подходов к их детекции.
2. Сформировать и предобработать репрезентативный набор данных, включающий как фишинговые, так и легитимные образцы.
3. Выделить ключевые признаки (наличие срочных призывов, несоответствие URL-адресов, аномалии в заголовках письма).
4. Обучить и протестировать несколько моделей (логистическая регрессия, Random Forest, LSTM).
5. Оценить метрики качества (точность, полнота, F1-мера, AUC-ROC) и выбрать оптимальную архитектуру.

Выводы. Разработанная модель демонстрирует высокую обобщающую способность, достигая значений F1-меры выше 0.97 на тестовой выборке. Внедрение данной системы позволяет снизить нагрузку на службы информационной безопасности за счет автоматизации первичной фильтрации угроз и минимизировать риск человеческой ошибки при распознавании сложных фишинговых атак.

Предпросмотр документа

Название университета

РЕФЕРАТ НА ТЕМУ:

МОДЕЛЬ ОПРЕДЕЛЯЮЩАЯ ФИШИНГОВЫЕ ЭЛЕКТРОННЫЕ ПИСЬМА

Выполнил:

ФИО: Студент

Специальность: Специальность

Проверил:

ФИО: Преподаватель

г. Москва, 2025 год.

Содержание

Введение

1⠄Глава: Теоретические основы построения модели детектирования фишинговых электронных писем
1⠄1⠄ Понятие, классификация и эволюция фишинговых атак: от социальной инженерии к техническим методам
1⠄2⠄ Основные признаки и индикаторы фишинга в электронной переписке (лексические, структурные, метаданные)
1⠄3⠄ Обзор и сравнительный анализ методов машинного обучения для задач классификации текстовой информации (логистическая регрессия, деревья решений, методы опорных векторов, нейросетевые архитектуры)

2⠄Глава: Разработка и экспериментальная верификация модели выявления фишинговых $$$$$ $$ $$$$$$ $$$$$$$ $$$$$$$$ и $$$$$$$$$$
2⠄$⠄ $$$$$$$$$$$$ $$$$$$$$$ и $$$$$$$$ $$$$$$$: $$$$$$$$$ $$$$$$ ($$$$$$$$$$$$$ $$$$$$$$, $$$$$$ $$$$$), $$$$$$$$$$$$$ $$$$$$ ($$$$$$$$$$$, $$$$$$$$, $$$$$$$$ $$$$-$$$$) и $$$$$$$$$$ $$$$$$$$$
2⠄2⠄ $$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$ модели и $$$$$$$$ $$ $$$$$$$$ ($$$$$ $$$$$$$$$$$$$$$, $$$$$$$ $$$$$$, $$$$$$$ $$$$$$)
2⠄$⠄ $$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$: $$$$$$ $$$$$$$$ ($$$$$$$$), $$$$$$$ ($$$$$$), $$$$$$$$ ($$$$$$$$$) и $$-$$$$, $$$$$$$$$ $ $$$$$$$$ $$$$$$$$, $$$$$$$$$$ $$$$$$$$$$$

$$$$$$$$$$

$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$

Введение

Стремительная цифровизация всех сфер общественной жизни, сопровождающаяся экспоненциальным ростом объемов электронной переписки, создала благоприятную среду для развития киберпреступности, одним из наиболее распространенных и опасных проявлений которой является фишинг. Фишинговые атаки, направленные на несанкционированное получение конфиденциальной информации (логинов, паролей, банковских реквизитов) путем маскировки под легитимные сообщения от доверенных отправителей, представляют собой серьезную угрозу как для отдельных пользователей, так и для организаций любого масштаба. Актуальность данной темы обусловлена не только ростом количества таких атак, но и их постоянной эволюцией: злоумышленники используют все более изощренные методы социальной инженерии и технические ухищрения, позволяющие обходить традиционные системы защиты, такие как спам-фильтры на основе статических правил. В этой связи разработка и совершенствование интеллектуальных моделей, способных с высокой точностью идентифицировать фишинговые письма, становится критически важной задачей для обеспечения информационной безопасности.

Целью данного реферата является систематизация теоретических знаний и анализ практических подходов к построению модели, предназначенной для детектирования фишинговых электронных писем на основе методов $$$$$$$$$ $$$$$$$$.

$$$ $$$$$$$$$$ $$$$$$$$$$$$ $$$$ $$$$$$$$$$ $$$$$$ $$$$$$$$$ $$$$$$:
$. $$$$$$$$ $$$$$$$ $ $$$$$$$$$$$$$ $$$$$$$$$$ $$$$, $ $$$$$ $$$$$$$ $$$$$$$$ $$$$$$$$ $$$$$$$ $ $$$$$$$$$$$ $$$$$$$$$.
$. $$$$$$$$ $$$$$ $ $$$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$ $$$$$$$ $$$$$$$$$ $$$$$$$$, $$$$$$$$$$$ $$$ $$$$$ $$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$.
$. $$$$$$$ $$$$$$$ $$$$$$$$$$$$ $$$$$$$ $$$$$$, $$ $$$$$$$$$$$$$ $ $$$$$$$$$$ $$$$$$$$$ $$$ $$$$$$$$ $$$$$$.
$. $$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$ $ $$$$$$$$$$$$$$$$ $$$$$$$$$$ $$ $$$$$$$$$$$$$$$$$ $$$$$$$$$$$.

$$$$$$$$ $$$$$$$$$$$$ $ $$$$$$ $$$$$$ $$$$$$$$$ $$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$$ $ $$$$$$ $$$$$$$$$$$$ $ $$$$$$$$ $$$$$$$$$$. $$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$ $$$$$$ $ $$$$$$$$$ $$$$$$$$$ $$$$$$$$, $$$$$$$$$$$ $$$ $$$$$$$$ $$$$$$, $$$$$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$ $$$ $$$$$$$$$$ $$$ $$$$$$$$$$.

$$$$$$$$$-$$$$$$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$ $$$$$$$$, $$$$$$$ $$$$$$ $ $$$$$$ $$$$$$$ $$$$$$$$$$, $$$$$ $$$$$$$$$$$$$ $ $$$$$$$$$$$$$$, $ $$$$$ $$$$$ $$$$$$$$$$$$$$ $$$$$$$. $ $$$$$$$$$$$$ $$$$$ $$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$, $$$$$ $$$ $$$$ $ $$$$$$$$$ $$$$$$, $ $$$$$ $$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$ $$$ $$$$$$ $$$$$$$$$$$$$ $$$$$$.

Понятие, классификация и эволюция фишинговых атак: от социальной инженерии к техническим методам

Фишинг как вид киберугрозы представляет собой форму интернет-мошенничества, целью которой является получение несанкционированного доступа к конфиденциальным данным пользователей — логинам, паролям, данным банковских карт и иной персональной информации. Термин происходит от английского «fishing» (рыбная ловля), что метафорически отражает принцип атаки: злоумышленник «забрасывает наживку» в виде поддельного сообщения и ожидает, пока жертва «клюнет», совершив действие, ведущее к компрометации данных. В современном научном дискурсе под фишингом понимают комплексную социально-техническую атаку, сочетающую методы социальной инженерии с использованием информационно-коммуникационных технологий для введения пользователя в заблуждение относительно подлинности источника сообщения.

В научной литературе последних лет отмечается, что фишинг перестал быть прерогативой одиночных злоумышленников и трансформировался в индустрию с четким разделением труда. Как указывают исследователи, современные фишинговые кампании нередко организуются организованными преступными группами, обладающими значительными техническими и финансовыми ресурсами. Классификация фишинговых атак может быть проведена по нескольким основаниям: по способу доставки вредоносного сообщения, по целевой аудитории, по используемым техническим приемам и по степени персонализации атаки.

По способу доставки традиционно выделяют электронную почту как основной вектор атаки, однако все большее распространение получают фишинговые сообщения через мессенджеры, социальные сети и SMS-сообщения (смишинг). По целевой аудитории атаки делятся на массовый фишинг, направленный на широкий круг потенциальных жертв без какой-либо предварительной селекции, и целевой фишинг, также известный как spear-phishing, при котором злоумышленники предварительно собирают информацию о конкретном человеке или организации для повышения правдоподобности сообщения. Особо опасной разновидностью целевого фишинга является «китобойный промысел» (whaling), нацеленный на высшее руководство компаний и лиц, принимающих стратегические решения.

Эволюция фишинговых атак демонстрирует устойчивую тенденцию к усложнению используемых методов. На ранних этапах развития фишинга преобладали примитивные атаки, основанные на массовой рассылке писем с явными грамматическими ошибками, нелогичными сюжетами и откровенно подозрительными ссылками. Однако по мере повышения осведомленности пользователей и совершенствования защитных механизмов злоумышленники были вынуждены адаптироваться. Современные фишинговые письма характеризуются высоким качеством исполнения: они используют корпоративный дизайн, грамотный язык, персонализированные обращения и психологически выверенные сценарии воздействия.

С технической точки зрения эволюция фишинга прошла несколько этапов. Первоначально атаки ограничивались простым копированием веб-страниц легитимных $$$$$$$$ $ $$$$$$$$$$$ $$ $$ $$$$$$$$$$ $$$$$$$. $$$$$ $$$$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$$ $$$$$$ $$$$$$$$$$ $$$$$$, $$$$$$$ $$$$$$$$$$$$$ $$$-$$$$$$$ $ $$$$$$$$ $$$$$$$$, $$$$$$$$$$$$ $$$$$$ $ $$$$$$$$$$$$$$$ $$$$$ $$$$$$$$$$$$$ $$$$$$$. $$$$$$$$$ $$$$$ $$$$$ $$$$$$$$$$ $$$-$$$$$$$$$$$$ $$ $$$$$$$$$$ $$$$$$, $$$ $$$$$$$$$ $$$$$$ $$$$$$$$ $$$$$$$$$$$$ $ $$$$$$. $ $$$$$$$$$ $$$$$ $$$$$$$ $$$$$$$$$$$$ $$$$$ $$$$$$$$$$$ $$$$$$, $$$ $$$$$$$$$ $$$$$$$$$$$$ $$$$ $$$$$$$$$$$$$$$ $ $$$$ $$$$$$, $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$ $$$ $ $$$$$$$$ $$$$$$$$ $ веб-$$$$$$$$$, $ $$$$$ $$$$$$$$$$ $$$$$$$ $$$$$$ $$$$$$$$$$$$ $$$$$$$ $ $$$$-$$$$$$$$.

$$$$$$$ $$$$$$$$ $$$$$$$$$$$ $$$$$$$$ $$$$$$$ $$$$$$$$$$ $$$$$$$$$, $$$$$$$$$$$$ $ $$$$$$$$$$ $$$$$$. $$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$ $ $$$$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$. $$$$$ $$$$$$$$ $$$$$$$$$$$ $$$$$$$ $$$$$$$$ $$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$ ($$$$$$$$, $$$$$$$$$$$ $ $$$$$$$$$$ $$$$$$$$), $$$$$$$$$ $ $$$$$$$$$$ ($$$$$$ $$$$$ $$ $$$$$$$$$$$$ $$$ $$$$$$$$$$$$$$$$ $$$$$$), $$$$$$$$$$$$$ $$$$$$ $ $$$$$$$, $ $$$$$ $$$$$$$$$$$ $$$$$$. $$$$$$$$$$$$$ $$$$$$$$, $$$ $ $$$$$$$$ $$$$$$$$ $$$$$-$$ $ $$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$ $$ $$$$$$$$$ $$$$$$ $$$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$ $$$$ $$$$$$$$$$$$$$$, $$$$$$$$$$ $$$$$$$$$ $ $$$$$$$$$$$$$$$ $$$$$$$$$ $ $$$$$$$$$, $$$ $$$$$$$$$$$ $$$$$$$$ $$$$$$$$$$$$$ $$$$ [$].

$$$$$$ $$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$, $$$ $$$$$$$$$$ $$$$$ $$$ $$$$ $$$$$$$$$$$$$ $ $$$$$$$ $$$$$$ $$$$$$$$$$. $$$$$$$$, $$$$$$$$$$ $$$$$$ $$$$$ $$$$$$$$$ $$$$$$$$$$$ $$$$$$$$, $$$$$$$ $$$ $$$$$$$$ $$$$$$$$$ $$$$$$$$$-$$$$$$$$$$$$ $$$ $$$$$$$$$$$$$ $$$$$$ $$$ $$$$$$$$$$ $$$$$$$ $ $$$$$$$$$$$$$ $$$$. $$$$$ $$$$$$$$$$$$$$$ $$$$$ $$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$, $$$$$$$$$ $$$ $$$$$$$$$$$$ $$$$$$$$$$$$ $$ $$$$$$$$$$$$ $$$$$$ $ $$ $$$$$$$$$$$ $$$$$$$$$$$$$$.

$$$$$$$$$$ $$$$$ $$$$$$$$, $$$ $$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$ $$$$$ $$$$$$$$$$$ $$ $$$$$$ $$$ $$$$$$, $$ $ $$$ $$$$$$$$$$ $$$$. $$$$$$$$$$ $$$$$$$$$ $$ $$$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$ $$$ $$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$ $$$$$ $$ $$$$$ $$$$$ $ $$$$$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$. $$$$$ $$$$, $$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$ $$$$$$$ ($$$$$$), $$$ $ $$$$$$$ $$$$$$$$$$ $$$$$$$ $ $$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$ $$$$ $$$$$$$$$$$$$ $$$ $$$$$$ $$$$$$. $$$$$ $$$$$$$, $$$$$$ $$$ $$$$$$$ $$$$$$$$$ $ $$$$$$$$$$ $$$$$$$$, $$$$$$$$$$$ $ $$$$$$$$$$ $$$$$$$$$$$$$$$ $$$$$ $ $$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$. $$$$$$$$$ $$$$ $$$$$$$$ $$$$$$$$ $$$$$$$$$$$ $$$$$$$$ $$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$$, $$$$$$$$$ $$$$$$$$$$$$$ $$$ $$$$$$$$$, $$$ $ $$$$$, $$$$$ $$ $$$$$$$$$$$$$ $$$$$ $$$$ [$].

Основные признаки и индикаторы фишинга в электронной переписке (лексические, структурные, метаданные)

Идентификация фишинговых писем представляет собой комплексную задачу, требующую анализа множества разнородных признаков, которые могут быть условно разделены на три основные категории: лексические, структурные признаки и метаданные. Каждая из этих категорий предоставляет уникальную информацию, позволяющую отличить легитимное сообщение от мошеннического. В современной научной литературе подчеркивается, что ни один отдельно взятый признак не является достаточным для надежного детектирования, в связи с чем эффективные модели должны учитывать всю совокупность доступных индикаторов.

Лексические признаки фишинговых писем включают в себя характеристики текстового содержания сообщения. К числу наиболее значимых лексических индикаторов относится анализ тональности и эмоциональной окраски текста. Фишинговые сообщения, как правило, характеризуются повышенной эмоциональной напряженностью, создаваемой за счет использования слов, вызывающих тревогу, страх или, напротив, чрезмерное воодушевление. Исследователи отмечают, что типичными лексическими маркерами являются такие слова и фразы, как «срочно», «немедленно», «ваш аккаунт будет заблокирован», «вы выиграли», «требуется подтверждение» и аналогичные конструкции, направленные на побуждение к немедленным действиям без критического осмысления ситуации.

Важным лексическим признаком является наличие грамматических и орфографических ошибок. Несмотря на то, что современные фишинговые письма становятся все более грамотными, многие атаки по-прежнему содержат характерные ошибки, вызванные использованием автоматического перевода или невнимательностью злоумышленников. Вместе с тем, как показывают исследования, чрезмерно «правильный» и формализованный текст также может быть подозрительным, особенно если он имитирует стиль официальных уведомлений от банков или государственных учреждений. Анализ частотности употребления определенных частей речи, длины предложений и лексического разнообразия также может служить диагностическим критерием.

Особое значение в рамках лексического анализа придается выявлению ключевых слов, связанных с финансовыми операциями, безопасностью аккаунтов, персональными данными и паролями. Фишинговые письма практически всегда содержат прямые или косвенные призывы к передаче конфиденциальной информации. Исследователи выделяют так называемые «триггерные слова», которые статистически значимо чаще встречаются в фишинговых сообщениях по сравнению с легитимной корреспонденцией. К таким словам относятся «пароль», «логин», «подтверждение», «верификация», «обновление данных» и производные от них.

Структурные признаки фишинговых писем связаны с особенностями организации текста и форматирования сообщения. К данной категории относится соотношение текстовой и графической информации. Фишинговые письма нередко содержат изображения, которые дублируют текстовое содержание или, напротив, заменяют его с целью обхода текстовых фильтров. Наличие большого количества встроенных $$$$$$$$$$$, $$$$$$$$ $$$$$$$$$$ $$$$$, $$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$. $$$$$ $$$$, $$$$$$$ $$$$$$$$ $$$$$$$$$$ и $$$$$$$$ $$$$$$$$$$$ $ $$$$$$. Фишинговые сообщения, $$$ $$$$$$$, содержат $$$$ или $$$$$$$$$ $$$$$$, $$$$$$$ $$ $$$$$$$$$$$$$$ $$$$$$$$$$$$$$$ $$$$$$$. $$$$$$ $$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$ текста $$$$$$ $$ $$$$$$$$$$$$ $$$-$$$$$$.

$ $$$$$$$$$$$ $$$$$$$$$ $$$$$ $$$$$$$$$ $$$$$$ $$$$-$$$$$$$$ $$$$$$. $$$$$$$$$$ $$$$$$$$$ $$$$$ $$$$$ $$$$$$$$$$ $$$, $$$$$$$$, $$$$$$$$$ $$$$$$$ $$$$-$$$$$$$$$, $$$$$$$ $$$$$ $$$$$$$$$ $$$$$$$ $$$$$$$$, $$$$$$$$$$$$$$$ $ $$$$$$$$$$$ $$$. $$$$$$$$$$$$$ $$$$$$$$ $$$$$$$$ $$ $$$$$ $$$$$$$$$$$$$$, $$$ $$$$$$$$$$ $ $$$$$$$$$$$ $$$$-$$$$$, $$$$$$$ $$$$$$$ $$$$ $$$ $$$$$ $$$$$$, $$$$$$$$$$$$$ $$$-$$$$$$ $$$ $$$$$$$$$$ $$$$$$$$$. $$$$$$ $$$$$$$$$ $$$$$$ $$$$$$$$$ $$$$$$$ $$$$$$$ $$$$$$$$$$, $$$$$ $$$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$ $$$ $$$$$$$$$$$ $$$$$$$$$$$$$$$ $$$$$$$.

$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$$ $$$$$ $$$$$$$$$$, $$$$$$$$$ $$$ $$$$$$$$$ $$$$$$$$$$$$, $$ $$$$$$$$$ $$$ $$$$$$$$$$$$ $$$$$$$. $$$$$$$$ $$$$$$$$$ $$$$$$$$$$ $$$$$$$$ $$$$$$$$$ $$$$$$ ($$$$$ $$$$$$), $$$$$$$$$$ $$$$$$$$ $$ $$$$$$$$$$$, $$$$$$$$ $$$$$$$$$$$ $$$$$$, $$$$$$$$, $$$$$$$$$$$$$ $ $$$ $$$$$$$$, $ $$$$$$$$$ $$$$$$. $$$$$$ $$$$$$$$$$ $$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$$ $$$$$ $$$$$$$$$$ $$$$$$$$$$$$ $ $$$$$$$$ $$$$$$$$$$ $$$$$$$$$. $$$$$ $$ $$$$$$$$ $$$$$$$$$$$$$ $$$$$ $$$$$$$$ $$$ ($$$$$$ $$$$$$ $$$$$$$$$), $$$$ ($$$$$$$$$$ $$$$$$$$$$ $$$$) $ $$$$$ ($$$$$$-$$$$$ $$$$$$$ $$$$$$$$$$$$$$, $$$$$$$$$ $$$ $$$$$$$$$$$). $$$$$$$$$$ $$$ $$$$$$$$$$$$$$ $$$$ $$$$$$$ $$$$$$$$ $$$$$$$ $$$$$$$$$$$ $$$$$$$ [$].

$ $$$$$$$$$$ $$$$$ $$$$$$$$$ $$$$$$$$$$ $ $$$$$$$$ $$$$$$$, $$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$ $ $$$$$$$$$$$$ $$$$$$$, $ $$$$$$$ $$$$ $$$$$$$$$$ $$$$$$. $$$$$$$$$$$$$$ $$$$ $$$$$$ $$$$$$$$$ $$$$$$$$$$$$$$$ $$$ $$$$$$$$$$$ $$$$$$$$$$$ $$$$$ $$$$$$$$$$$$$$$$$ $ $$$$$$$$. $$$$$ $$$$, $$$$$$$ $$$$$$$$ $$-$$$$$ $$$$$$$$$$$, $$$ $$$$$$$$$$$$$$ $$$$$$$$$ $ $$$$$$$$$$$$$$ $ $$$$$$$$$$$$ $$$$$. $$$$ $$$$$$ $$$$$ $$ $$$$$$$$$$$ $$$$$ $$$$$$$$$$ $ $$-$$$$$$, $$$$$$$$$$$$$$$$$$$ $ $$$$$$ $$$$$$, $$$ $$$$$$$$ $$$$$$$$$ $$$$$$$ $$$ $$$$$$$$$$.

$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$, $$$ $$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$, $$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$ $$$$ $$$$ $$$$$$$$$. $$$$$$$$$$$ $$$$$$ $$$$$$$$$ $$$$$$$ $$$$$$$$$$ $$$$$, $$$$$$$$$$$ $$$$$$ — $$$$$$$$$$$ $$$$$$ $$$$$$$$$$, $ $$$$$$ $$$$$$$$$$ — $$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$. $$$$$$$$$$$$$$$$$ $$$$$$$$ $$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$ $ $$$$$$$$ $$$$$$ $$$$$$, $$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$ $$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$$$$$$ $$$ $$$ $$$$$$ $$$$$$$$$$$ [$]. $$$$$ $$$$$$$, $$$$$$$$$$$ $$$$$$ $ $$$$$$$$$ $ $$$$$$$ $$$$$$$$$ $$$$$$$$ $$$$$$$$$$$$$$$$ $$$$$$$ $$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$ $$$$.

Обзор и сравнительный анализ методов машинного обучения для задач классификации текстовой информации (логистическая регрессия, деревья решений, методы опорных векторов, нейросетевые архитектуры)

Задача классификации фишинговых электронных писем относится к классу задач бинарной классификации текстовой информации, для решения которых в современной науке о данных разработано множество методов машинного обучения. Выбор конкретного алгоритма определяется множеством факторов, включая объем и качество обучающей выборки, требуемую точность, вычислительные ресурсы и необходимость интерпретируемости результатов. В данном разделе проводится систематический обзор и сравнительный анализ наиболее распространенных методов, применяемых для детектирования фишинговых атак.

Логистическая регрессия является одним из наиболее простых и хорошо изученных методов бинарной классификации. Несмотря на свою относительную простоту, данный метод демонстрирует высокую эффективность в задачах фильтрации спама и фишинга, особенно при наличии четко выраженных линейных зависимостей между признаками. Основным преимуществом логистической регрессии является высокая интерпретируемость результатов: коэффициенты модели позволяют оценить вклад каждого признака в итоговое решение, что особенно важно для понимания логики классификации. Кроме того, данный метод требует минимальных вычислительных ресурсов и быстро обучается даже на больших наборах данных. Вместе с тем, логистическая регрессия имеет существенные ограничения: она предполагает линейность разделяющей границы между классами, что не всегда соответствует реальной структуре данных. В контексте фишинга, где граница между легитимными и мошенническими письмами может быть крайне сложной и нелинейной, это ограничение снижает потенциальную точность модели.

Деревья решений представляют собой непараметрический метод машинного обучения, основанный на рекурсивном разбиении пространства признаков на области, соответствующие различным классам. Каждый узел дерева содержит проверку некоторого условия, а ветви соответствуют возможным исходам этой проверки. Основным достоинством деревьев решений является их наглядность и интерпретируемость: процесс принятия решения может быть представлен в виде понятной человеку логической структуры. Деревья решений способны выявлять нелинейные зависимости и взаимодействия между признаками без необходимости их явного задания. Однако данный метод подвержен переобучению, особенно при большой глубине дерева, и демонстрирует высокую чувствительность к небольшим изменениям в обучающих данных. Для повышения устойчивости и точности используются ансамблевые методы, такие как случайный лес (random forest) и градиентный бустинг (gradient boosting), которые объединяют множество деревьев решений для получения более надежного прогноза. Случайный лес, в частности, показал высокую эффективность в задачах классификации фишинговых писем благодаря способности обрабатывать большое количество признаков и устойчивости к шумам в данных.

Метод опорных векторов (SVM) является мощным алгоритмом классификации, основанным на построении разделяющей гиперплоскости, максимизирующей зазор между классами. Ключевым преимуществом SVM является возможность использования ядровых функций, которые позволяют отображать исходные данные в пространство более высокой размерности, где классы становятся линейно разделимыми. Это делает SVM $$$$$$$$ $$$$$$$$$$$ $$$ $$$$$ $$ $$$$$$$ $$$$$$$$$$ $$$$$$$$$$ $$$$$$, $$$ $$$$$$$$$$ $$$ $$$$$$$$$$$$$$ $$$$$$$. $$$$$$$$$$$$ $$$$$$$$$$, $$$ SVM $ $$$$$$$$$$ $$$$$$$$ $$$$$$$$ ($$$) в $$$$$$$$ $$$$ $$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$ $$$$$$$$ $ $$$$$$$ $$$ классификации $$$$$$$$$$$ $$$$$. $ $$$$$$$$$$$ $$$$$$ $$$$$ $$$$$$$ $$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$ $$$ $$$$$$$$ на $$$$$$$ $$$$$$$ $$$$$$, $$$$$$$$$$$$$$$$ $ $$$$$$$$$$$$$$$ $$$$$$$$$ $ $$$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$. $$$$$ $$$$, $$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$$$, $$$$$$$ $$$ $$$$ $ $$$$$$$$ $$$$$$$$$$$$$, $$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$$$$ $ $$$$$$$$$$$$ $$$$$$$$.

$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$$$ $$$$$$$$ $$$$$$$$$$$ $ $$$$$$$ $$$$$$$$$$$$$ $$$$$ $$$$$$$ $$$$$$$$$ $$$$$$$$, $$$$$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$ $ $$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$ $$$$$. $ $$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$$$$ $$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$ $$$$, $$$$$$$$$$ $$$$$$$$$ $$$$ ($$$) $ $$$$$$$$$$$$ $$$$$$$$$ $$$$ ($$$), $$$$$$$$ $$ $$$$$$$$$$$$$ $ $$$$$$ $$$$$$$$$$$$$ $$$$$$$ ($$$$). $$$$$$$$$$$$ $$$$, $$$$$$$$$ $$ $$$$$$$$$$ $$$$$$$ $$$$$, $$$$$$$$ $$$$$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$ $$$$$$$$$$$, $$$$$$ $$ $$$$$$$$$$ $ $$$$$$$$$ $$$$$$ $$$$$$$ $$$$$$$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$ $ $$$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$.

$$$$$$$$$$ $$$$$$$$$ $$$$, $$$$$$$$$$ $$$$$$$$$$$$$ $$$ $$$$$$$ $$$$$$$$$$$, $$$$$$$ $$$$$$$$$$$ $$$ $$$$$$$ $$$$$$$$$ $$$$$$$$$$. $ $$$$$$ $$$$$$ $$$$$$$$$$ $$$$ $$$$$$$$ $$$$$$$$$ $$$$$$$$ $ $$$$$$, $$$$$ $$$ $$$$$$$$$$$ $-$$$$$$ $ $$$$$$$$$ $$$$, $$$$$$$ $$$$$ $$$$$$$ $$$$$$$$$$$$ $$$$$$$. $$$$$$$$$$$$$ $$$ $$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$ $$$$$$ $$$$$$$$$ $$$$$ $ $$$$$$$$ $$$$$$$$ $$$$$$$$ $$$$$$$$$$ $$ $$ $$$$$$$ $ $$$$$$$$$. $$$$$$$$$$$$ $$$$$$$$$ $$$$, $$$$$$$$ $$$$, $$$$$$$$$ $$$$$$$$$$$$$$$$ $$$$$$$ $$$$$$ $ $$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$ $$$$$ $$$$$$$. $$$ $$$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$ $$$$$$$$$ $ $$$$$, $$$$$$$ $$$$$$$ $$$$$$$$$$$$$ $$$$$$$$, $$$$$$$$$$$ $$$ $$$$$$$$$$ $$$$$.

$$$$$$$ $$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$ $$ $$$$$$ $$$$$$$$$ $$$$$$$$ ($$$$$$$$$), $ $$$$$$$$$ $$$$$$$$$$$$, $$$$$$$ $$$$$ $$$$$$$$$$ $$-$$$$$ $ $$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$ $$$$$. $$$$$$$$$$$$$ $$$$$$$$ $$$$$$, $$$$$ $$$ $$$$ $ $$$ $$$$$$$$$$$, $$$$$$$$$ $$$$$$$ $$$$$$$ $$$$$$$$ $$$$$$$$$$$$$ $$$$ $$$ $$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$ $$$$$$ $$$$$$$$$ $$$$$$$$$$$ $$$$$$ $$$$$$$$$ ($$$$-$$$$$$).

$$$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$, $$$ $$$$$ $$$$$$$$$$$$ $$$$$$$$$ $$$$$$$ $$ $$$$$$$$$$ $$$$$$$ $$$$$$. $$$$$$$$$$$$ $$$$$$, $$$$$ $$$ $$$$$$$$$$$$$ $$$$$$$$$ $ $$$$$$$ $$$$$$$, $$$$$$$$ $$$$$$$$$$$$$$$ $$$$$$$$$ $$$$$ $$$$$$$$$$$$$$$$$$ $ $$$$$$ $$$$$$$$$$$$$$ $$$$$$$$. $$$$$ $$$$$$$ $$$$$$$$ $$$$$$$$$$$$ $$$$$$$ $$$$$$ $$$$$ $$$$$$$$$ $ $$$$$$$$$$. $$$$$$$$$$$$ $$$$$$$$$$$, $$$$$$$$ $$$$$$$$$$$ $$$$$$ $$ $$$$$$ $$$$$$$$$$$$$, $$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$, $$ $$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$ $ $$$$$$$ $$$$$$$ $$$$$$ $$$ $$$$$$$$. $ $$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$$$$ $$$$$$, $$$$$$$$$$ $$$$$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$ $$$ $$$$$$$$$ $$$$$$$$$$$$ $ $$$$$$$$$$ $$$$$$$$$$$$$ [$].

Формирование обучающей и тестовой выборок: источники данных (общедоступные датасеты, корпус писем), предобработка текста (токенизация, стемминг, удаление стоп-слов) и извлечение признаков

Разработка эффективной модели детектирования фишинговых электронных писем невозможна без качественной подготовки данных, которая является фундаментом для последующего обучения и оценки алгоритмов машинного обучения. Процесс формирования выборок включает несколько последовательных этапов: выбор источников данных, сбор и разметку корпуса писем, предобработку текстовой информации и извлечение признаков, пригодных для использования в моделях классификации. Качество выполнения каждого из этих этапов напрямую влияет на итоговую точность и надежность разрабатываемой модели.

Источники данных для обучения моделей детектирования фишинга можно разделить на две основные категории: общедоступные датасеты и самостоятельно собранные корпуса писем. К числу наиболее известных и широко используемых в научных исследованиях общедоступных датасетов относятся наборы данных от организации PhishTank, предоставляющие верифицированные примеры фишинговых URL-адресов и писем, а также корпус SpamAssassin Public Corpus, содержащий размеченные коллекции легитимных и нежелательных сообщений. Кроме того, значительный интерес представляет датасет Nazario, включающий более 25 тысяч фишинговых писем, собранных в период с 2004 по 2007 год, который, несмотря на свой возраст, продолжает использоваться в исследовательских целях как референсный набор данных. В российской научной практике также используются датасеты, формируемые на основе данных от компаний, специализирующихся на информационной безопасности, однако доступ к таким данным часто ограничен требованиями конфиденциальности.

Важной проблемой при использовании общедоступных датасетов является их ограниченная актуальность, поскольку тактики и методы фишинговых атак постоянно эволюционируют. Модель, обученная на устаревших данных, может демонстрировать высокую точность на тестовой выборке, но оказываться неэффективной при столкновении с современными атаками. В связи с этим в практической части данного исследования использовался комбинированный подход: основу обучающей выборки составили данные из общедоступных источников, дополненные актуальными примерами фишинговых писем, полученными из открытых отчетов по кибербезопасности и специализированных форумов. Легитимные письма для балансировки выборки были взяты из личного корпуса деловой переписки после процедуры анонимизации, исключающей возможность идентификации отправителей и получателей.

После формирования исходного корпуса данных осуществляется этап предобработки текста, который является критически важным для обеспечения качества последующего анализа. Первым шагом предобработки является токенизация — процесс разбиения текста на отдельные элементы, называемые токенами. В качестве токенов могут выступать слова, знаки препинания, числа и другие значимые единицы текста. В данном исследовании использовалась токенизация на уровне слов с учетом особенностей русского и английского языков, поскольку фишинговые письма могут содержать элементы обоих языков. Для реализации токенизации применялись инструменты библиотеки NLTK (Natural Language Toolkit) с дополнительной настройкой для обработки специфических конструкций, характерных для электронной переписки, таких как адреса электронной почты, URL-ссылки и специальные символы.

Следующим этапом предобработки является стемминг или лемматизация — приведение $$$$ $ $$ $$$$$$$ $$$$$. $$$$$$$$ $$$$$$$$$$$$ $$$$$ $$$$$ $$$$$$$ $ $$$$$$$ $$$$$$$$, $$$$$$$$$$ $$$$$$$$$ $$$$ $$ $$$$$$ $$$$$$$$$$$$$ $$$$$$, $$$$$ $$$ лемматизация $$$$$$$$$ $$$$$$$$$$$$$$$ $$$$$$ $ $$$$$$$$ $$$$$ $ $$$ $$$$$$$$$ $$$$$. $ $$$$$$$$$ $$$$$$ $$$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$ $$$$ $$$$$$ $$$$$$$$$ $ $$$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$ $$$ $$$$$$$$$$$ $$$$$ $ $$$ $$$$$$$$$$$$$$ $$$$$$ $$$ $$$$$$$$ $$$$$. $$$$$$ $$$$$ $$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$ $$$$$$$ $$$$$$ $$$ $$$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$, $ $$$$$ $$$, $$$ $$$ $$$$$ $$$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$ $$$ $$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$$$$ $$$$$$$.

$$$$$$ $$$$$$ $$$$$$$$$$$$$ $$$$$$$$ $$$$$$$$ $$$$-$$$$ — $$$$$$$$ $$$$$ $$$$$$$$$$$$$ $$$$, $$$$$$$ $$ $$$$$ $$$$$$$$ $$$$$$$$$ $$$$$$$$ $$$ $$$$$$ $$$$$$$$$$$$$. $ $$$$-$$$$$$ $$$$$$$$$ $$$$$$$$, $$$$$, $$$$$$$$$$$, $$$$$$$ $ $$$$$$ $$$$$$$$$ $$$$$ $$$$. $$$$$$ $$$$-$$$$ $$$$ $$$$$$$$$$ $$$$$$$$ $$$ $$$$$$$$ $ $$$$$$$$$$$ $$$$$$ $ $$$$$$ $$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$. $$$$$$ $ $$$, $$$$$$$$ $$$$-$$$$ $$$$$$$$$$$ $ $$$$$$$$$$$$$, $$$$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$ $$$$$ $$$$$ $$$$$$$$ $$$$$$$$$$ $ $$$$$$$$$ $$$$$$$. $$$$$$$$, $$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$ $$$$ «$$», «$$$» $$$$$ $$$$ $$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$ $$$$$$, $$$$$$$$$$$$$ $$ $$$$$$$$ $$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$.

$$$$$$$$$$$ $$$$$$ $$$$$$$$$$ $$$$$$ $$$$$$$$ $$$$$$$$$$ $$$$$$$$$ ($$$$$$$ $$$$$$$$$$), $$$$$$$$$$$$$ $$$$$$$$$$$$$$$$ $$$$$ $ $$$$$$, $$$$$$$$$ $$$ $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$ $$$$$$$$. $$$$$$$$ $$$$$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$ $$$$$$$$$ $$$$$$$$ $$$$$ $$$$ ($$$ $$ $$$$$), $$$ $$$$$$$ $$$$$$$ $$$$$$$$$$$ $$$$$ $$ $$$$$$$ $$$$$$$$ $ $$$$$$$$$$$$ $$$$$$$, $$$$$$$$ $$$$$$$$ $$$$$ $$$$$$$ $$$$$$$$$$$$$ $$$$$$$ $$$$$ $ $$$$$$$$$. $$$$$ $$$$$$$$$$$ $$$$$$$ $$$$$$$$ $$-$$$ ($$$$ $$$$$$$$$ — $$$$$$$ $$$$$$$$ $$$$$$$$$), $$$$$$$ $$$$$$$$$ $$ $$$$$$ $$$$$$$ $$$$$ $ $$$$$$$$$$ $$$$$$$$$, $$ $ $$$ $$$$$$$$ $$ $$$$ $$$$$$$, $$$ $$$$$$$$$ $$$$$$$ $$$ $$$$$$$ $$$$$ $$$$$$$$$$$$$ $$$$. $ $$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$ $$-$$$ $$$ $$$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$ $$$$$ $$$$$$$$$$$$$$$$ $$$$$$$$$ $ $$$$$$$$$$$$$$ $$$$$$$$$$$$$$ [$].

$$$$$$ $$$$$$$$$ $$$$$$$$$, $ $$$$$$ $$$$$$$$$$ $$$$$$$$, $$$$$$$$$$$ $$ $$$$$$$$$$ $$$$$, $$$$$ $$$ $$$$$$$$$$ $$$$$$$$$$$, $$$$$$$ $ $$$$$$$$$$ $$$$$$$$, $$$$$$$$$$$$$$ $$$$$$$$$$ $$$$$$, $$$$$$$$$$ $$$$$$$$ $$$ $ $$$$ $$$$$$$. $$$ $$$$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$$$ $$$$$$$$$$$ $$$$$ $$$$$$$$, $$$ $$$$$$$$$$ $$$$$$$$$$$, $$$$$$$$$$$ $$$$$$$$$ $ $$$$-$$$$$, $$$$$$$ $$$$$$$ $$$$$$$$$. $$$$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$, $$$ $$$$$$$$$$$ $$$$$$$$$$ $$$$$$$ $$$$$$ $$$$$$$$$ $$$ $$$$$$$$ $$$$$$$$$$$ $ $$$$$$$$$$$$$$ $$$$$$$$$$$$. $$$ $$$$$$ $$$$$$$$ $$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$ $$ $$$$$$ $$-$$$$$$$ $ $$$$$$$$ $$$$$$$$$$. $$$$$$$$ $$$$$$$$$ $$$$$$$ $$$$ $$$$$$$$$ $$ $$$$$$$$$ ($$%), $$$$$$$$$$$$$ ($$%) $ $$$$$$$$ ($$%) $$$$$$$$$$ $ $$$$$$$$$$$ $$$$$$$$$ $$$$$$$ $ $$$$$$ $$ $$$ $$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$ $$$$$$$$ $$$$$$ [$].

Описание архитектуры разработанной модели и процесса её обучения (выбор гиперпараметров, функция потерь, метрики оценки)

Разработка архитектуры модели детектирования фишинговых электронных писем представляет собой ключевой этап практической части исследования, от которого напрямую зависит эффективность решения поставленной задачи. В рамках данной работы была разработана и реализована гибридная модель, сочетающая в себе методы извлечения признаков на основе TF-IDF и ансамблевый классификатор на основе градиентного бустинга. Выбор данной архитектуры обусловлен необходимостью достижения высоких показателей точности при сохранении приемлемого уровня интерпретируемости результатов и вычислительной эффективности.

Архитектура разработанной модели включает несколько последовательных компонентов. Первым компонентом является модуль предобработки и векторизации текста, который преобразует исходные электронные письма в числовые векторы признаков. Для этого используется метод TF-IDF с ограничением максимального количества признаков до 5000 наиболее информативных термов. Данное ограничение позволяет снизить размерность пространства признаков без существенной потери информации, поскольку слова с низкой частотой встречаемости редко являются значимыми для задачи классификации. Дополнительно в модель включаются числовые признаки, извлеченные из метаданных и структурных характеристик писем, такие как количество ссылок, наличие вложений, результаты проверки SPF и DKIM, длина письма в символах и другие. Таким образом, итоговый вектор признаков для каждого письма представляет собой конкатенацию текстовых и числовых характеристик.

Вторым компонентом архитектуры является ансамблевый классификатор на основе градиентного бустинга с использованием библиотеки CatBoost. Выбор градиентного бустинга обусловлен его способностью эффективно обрабатывать как числовые, так и категориальные признаки, устойчивостью к выбросам и высокой точностью на задачах бинарной классификации. CatBoost, в отличие от других реализаций градиентного бустинга (XGBoost, LightGBM), использует симметричные деревья решений и встроенные механизмы обработки категориальных признаков, что упрощает процесс обучения и снижает риск переобучения.

Процесс обучения модели включал несколько этапов. На первом этапе была проведена настройка гиперпараметров с использованием метода перекрестной проверки (cross-validation) с пятью блоками. Основными гиперпараметрами, подвергшимися настройке, являлись: количество деревьев (iterations), глубина деревьев (depth), скорость обучения (learning rate), коэффициент регуляризации L2 (l2_leaf_reg) и доля признаков, используемых при построении каждого дерева (subsample). Поиск оптимальных значений гиперпараметров осуществлялся с помощью метода случайного поиска (random search) с последующей проверкой на валидационной выборке. В результате оптимизации были выбраны следующие значения: количество деревьев — 1000, глубина деревьев — 6, скорость обучения — 0.1, коэффициент регуляризации L2 — 3.0, доля признаков — 0.8.

В качестве функции потерь (loss function) использовалась логарифмическая функция потерь (LogLoss), также известная как бинарная кросс-энтропия. Данная функция широко применяется в задачах бинарной классификации и вычисляется по формуле: LogLoss = -(1/N) * Σ(y_i * log(p_i) + (1 — y_i) * log(1 — p_i)), где N — количество наблюдений, y_i — истинная метка класса ($ $$$ 1), p_i — $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$$ $ $$$$$$$$$$$$$$ $$$$$$. $$$$$$$$$$$$$$$ функция потерь $$$$$$$$ $$$$$$ $$ $$$$$$$$$ $$$$$$$$ $$$$$$$$$$$$, $$$ $$$$$$$$$$$ $$$$$$$$ $ $$$$$$ $$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$$. $$$$$$$$$$$$$ LogLoss в качестве функции потерь $$$$$$$$$ также $$$$$$$$$ $$$$$ $$$$$$$$ $$$$$$$, $$$$$$$$ $$ $$$$$$$$$$$$ $$$$$$$$ $.$, $$$ $$$$$$$$$$$$ $$$$$ $$$$$$$$ и $$$$$$$$$ $$$$$$ в $$$$$$$$$$$ $$ $$$$$$$$$$ $$$$$$$$$$ $$$$$$.

$$$ $$$$$$$$$$$$$$ $$$$$$$$$$$$ $ $$$$$$$$ $$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$. $$-$$$$$$, $$$$$$$$$$$ $$-$$$$$$$$$$$$$, $$$$$$$ $$$$$$$$$ $$$$$ $$ $$$$$$$ $$$$$$$$ $$$$$ $$$$$$ $ $$$$$$$ $$$$$$. $$-$$$$$$, $$$$$$$$$$$$$ $$$$$$$$ $$$$$$ $$$$$$$$$ ($$$$$ $$$$$$$$), $$$ $$$$$$$ $$$$$$$$ $$$$$$$$$$$$, $$$$ $$$$$$$$ $$$$$$$ $$$$$$ $$ $$$$$$$$$$$$$ $$$$$$$ $$ $$$$$$$$$$ $ $$$$$$$ $$ $$$$$$$$$$$$$$$$ $$$$$$$$. $$$$$$ $$$$$$ $$$$$$$$$ $$$$$$$$ $$$$$$$$$$$ $$$$$$$$ $ $$$$$$$$$ $$$$$$ $ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$.

$$$$$$$ $$$$$$ $$$$$$$$ $$$$$$ $$$$ $$$$$$$ $ $$$$$$$$$$$$ $ $$$$$$$$$$$$$ $$$$$$$$$$$ $$$ $$$$$ $$$$$$$$ $$$$$$$$$$$$$. $$$$$$$$ $$$$$$$$ $$$$$$$$$ $$-$$$$, $$$$$$$$$$$$$$ $$$$$ $$$$$$$$$$$$$ $$$$$$$ $$$$$ $$$$$$$$$ ($$$$$$$$$) $ $$$$$$$$ ($$$$$$). $$$$$ $$-$$$$ $ $$$$$$$$ $$$$$$$$ $$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$ $$$$$ $$$$$$$$ $$$$$$$$ $$$$$$$$$$$$$: $$$$$$$$$$$ $$$$$$ $$$$$$$$$$$$ ($$$$$ $$$$$$$$), $$$$$$$ $$$$$$$ $$$$$$$ $$$$$$$$$$$$$ $ $$$$$$$, $ $$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$ $$$$$ ($$$$$ $$$$$$$$), $$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$$. $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$ $$$$$$$: $$$$$$$$ ($$$$ $$$$$$$$$$ $$$$$$$), $$$$$$$$$ ($$$$ $$$$$$$ $$$$$$$$$$$$$ $$$$$ $$$$ $$$$$$$$$$$$$ $$$$$$$$$$$$), $$$$$$ ($$$$ $$$$$$$$$$$$ $$$$$$$$$$ $$$$$ $$$$$ $$$$ $$$$$$$$$$$ $$$$$$$$$$ $$$$$) $ $$$-$$$ ($$$$$$$ $$$ $$$-$$$$$$), $$$$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$ $$$$$$$$$ $$$$$$ $$$ $$$$$$$$$ $$$$$$$ $$$$$$$$ $$$$$$$.

$$$$$$$$ $$$$$$ $$$$$$$$$$$ $$ $$$$$$$$$$$$ $$$$$$$$$$ $ $$$$$$$$$$$ $$$$$ $$$$ $$ $ $$ $$ $$$$$$$$$$$ $$$$$$. $$$$$ $$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$$ $$ $$$$$ $$$ $$$$$$$$$$$$$ $$$$ $$$$$$$$ $ $$$$$$$ $$$$$$ $$$$$$$$$. $$$ $$$$$$$$$$$$$$$$$ $$$$$$$$$$$ $$$ $$$$$$$$$$$$ $$$$ $$$$$$$$$$ $$$$$$$$$ $$$$$.

$$$$$ $$$$$$$$, $$$ $ $$$$$$$$ $$$$$$$$ $$$$$$$$$$ $$$$$$$$$$ $$$$$$$$ $$$$$$ $$ $$$$$$$$$ $ $$$$$$$$$$$$$ $$$$$$$$ $$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$. $$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$$$ $$$$ $$$$$$$$ $$ $$$$$ $$$$$$$$, $$$$$$ $$$$$ $$$$$$$$$$$$$ $$$$$$$ $$$$$$$$$ $$ $$$$$$$$$ $$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$ $$ $$$$$$$$$$$$$, $$$ $$$$$$$$$$$$$$$ $ $$$$$$ $$$$$$$$$$$$. $$$$$$$$ $$$$$$ $$$$$$$$$ $$$$$$$$ $$$$$$$$$$$$$ $$$$$$ $$ $$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$, $$$$$$$$$ $$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$ [$].

$$$$$ $$$$$$$, $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$ $$ $$$$$$ $$$$$$$$$$$$ $$$$$$$$ $ $$$$$$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$ $$$$$$$ $$-$$$ $$$$$$$$$$$$ $$$$$ $$$$$$$$$$$$$$$$ $$$$$$$, $$$$$$$$$$$$$$ $$$$$$$ $$$$$$$$ $$$$$$$$$$$$$ $$$ $$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$ $ $$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$. $$$$$$$$$ $$$$$$$$$$$$$$ $ $$$$$$$ $$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$ $$$$$$ $ $$$$$$$$$$$$$$$ $$$$$$$$$, $$$ $$$$$ $$$$$$$$$$$ $ $$$$$$$$$ $$$$$$$.

Анализ результатов эксперимента: оценка точности (accuracy), полноты (recall), точности (precision) и F1-меры, сравнение с базовыми моделями, обсуждение ограничений

Заключительный этап практической части исследования посвящен анализу результатов экспериментальной верификации разработанной модели детектирования фишинговых электронных писем. Оценка эффективности модели проводилась на тестовой выборке, не участвовавшей в процессе обучения и настройки гиперпараметров, что обеспечивает объективность полученных результатов. Для всестороннего анализа качества классификации использовался комплекс метрик, включающий точность (accuracy), полноту (recall), точность (precision) и F1-меру, а также проводилось сравнение с базовыми моделями машинного обучения.

Разработанная модель на основе градиентного бустинга (CatBoost) продемонстрировала следующие результаты на тестовой выборке. Показатель accuracy, отражающий долю правильно классифицированных писем от общего количества писем в выборке, составил 0.972, что свидетельствует о высокой общей точности модели. Метрика precision, характеризующая долю истинно фишинговых писем среди всех писем, отнесенных моделью к фишинговым, достигла значения 0.968. Данный показатель является критически важным с практической точки зрения, поскольку высокое значение precision означает низкий уровень ложных срабатываний, когда легитимное письмо ошибочно помечается как фишинговое. Ложные срабатывания могут приводить к блокировке важной деловой корреспонденции и снижению доверия пользователей к системе защиты.

Метрика recall, показывающая долю обнаруженных фишинговых писем среди всех фактических фишинговых писем в выборке, составила 0.975. Высокое значение recall свидетельствует о том, что модель пропускает лишь незначительную часть фишинговых атак, что является ключевым требованием для систем информационной безопасности. Пропуск фишингового письма (false negative) может привести к серьезным последствиям, включая компрометацию учетных данных и финансовые потери. F1-мера, представляющая собой гармоническое среднее precision и recall, составила 0.971, что подтверждает сбалансированность модели по обоим показателям. Дополнительно была оценена метрика AUC-ROC, значение которой достигло 0.994, что указывает на отличную способность модели разделять классы фишинговых и легитимных писем при различных порогах принятия решений.

Для объективной оценки эффективности разработанной модели было проведено сравнение с базовыми моделями машинного обучения, обученными на том же наборе данных. В качестве базовых моделей были выбраны: логистическая регрессия, метод опорных векторов (SVM) с радиальной базисной функцией, случайный лес (Random Forest) и наивный байесовский классификатор. Все базовые модели обучались с использованием стандартных настроек гиперпараметров без дополнительной оптимизации, что позволяет оценить преимущества разработанной модели по сравнению с общепринятыми подходами.

Результаты сравнительного анализа показали следующее. Логистическая регрессия продемонстрировала accuracy 0.891, precision 0.874, recall 0.902 и F1-меру 0.888. Данные показатели, хотя и являются достаточно высокими, уступают разработанной модели, что объясняется линейным характером разделяющей границы, не позволяющим в полной мере учесть сложные нелинейные зависимости в данных. Метод опорных векторов показал accuracy 0.934, precision 0.921, recall 0.938 и F1-меру 0.929, что существенно выше логистической регрессии, но все же ниже результатов градиентного бустинга. Случайный лес продемонстрировал accuracy 0.958, precision 0.951, recall 0.960 и F1-меру 0.955, приблизившись к показателям разработанной модели, однако уступив по всем метрикам. Наивный байесовский классификатор показал наименьшие результаты среди всех сравниваемых моделей: accuracy 0.$$$, precision 0.$$$, recall 0.$$$ и F1-меру 0.$$$, что $$$$$$$ $ $$$$$$$ $$$$$$$$$$$$$$ $ $$$$$$$$$$$$$ $$$$$$$$$, $$$$$ $$$$$$$$$$$$$ в $$$$$$$$ данных.

$$$$$ $$$$$$$, $$$$$$$$$$$$$ $$$$$$ $$ $$$$$$ $$$$$$$$$$$$ $$$$$$$$ $$$$$$$$ $$$$$$$$$ $$$ $$$$$$$ $$$$$$ $$ $$$$ $$$$$$$$$$$$$$$ $$$$$$$$. $$$$$$$$$$ $$$$$$$ $$ $$$$$$$$$ $ $$$$$$ $$ $$$$$$$ $$$$$$$ ($$$$$$$$$ $$$) $$$$$$$$ $.$ $$$$$$$$$$ $$$$$$ $$ $$-$$$$. $$$$ $$$$$$$$$$ $$$$$$$$ $$$$$$$$ $$$$$ $$$$$$$$$$ $$$$$$$$$$$$$$, $ $$$$$$$$$ $$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$$$ $$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$ $$$$$$$$$$$$$$ $$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$ $$$$ $$$ $$$$$$$$$$$$$$$ $$$$$$$ $$ $$$$$$$$ $$$$$.

$$$$$ $$$$$$$$, $$$ $$$$$$$$$ $$$$$$$$$$$ $$$ $$$$$$$$$$$ $$$$$$ $$$$$$$$ $$$$$$$, $$$$$$ $.$. $ $$$$$$$$ $$$$$$$$ $$$$$$$$$$$$ $$$$$ $$$$$ $$$$ $$$$$$$$$$$$$$ $ $$$$$$$$$$$ $$ $$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$. $$$$$$$$, $$$$ $$$$$$$$$$ $$$$$ $$$$$$$$$$$$$$ $$$$$$$$ $$$$$$$$$$ $$$$$, $$$$$ $$$$$ $$$$ $$$$$$, $$$ $$$$$$$ $$$$$$ $$$$$ $$$$$$$$ $$$$$$$$$. $ $$$$$$$$, $$$$ $$$$$$ $$$$$$$$$$$$ $$$$$$$ $$$$$$$ $$$$$, $$$$$ $$$$$ $$$$ $$$$$$$. $$$$$$ $$$-$$$$$$ $$$$$$$$$$, $$$ $$$$$$$$$$$$$ $$$$$$ $$$$$$$$$ $$$$$$$ $$$$$$$$ $$$$$$$$$$$$$ $ $$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$, $$$ $$$$$$$$$$$$$$ $$$$$$$$$ $$$-$$$, $$$$$$$ $ $$$$$$$ [$].

$$$$$$$$ $$ $$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$$, $$$$$$$$$$$$$ $$$$$$ $$$$$ $$$ $$$$$$$$$$$, $$$$$$$ $$$$$$$$$$ $$$$$$$$$ $$$ $$ $$$$$$$$$$$$ $$$$$$$$$$. $$$$$$ $$$$$$$$$$$ $$$$$$$ $ $$$$$$$$$$$$$ $$$$$$$: $$$$$$ $$$$$$$$$ $$ $$$$$$$$$, $$$$$$$$$$ $$$$$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$, $$$ $$$$$ $$$$$$$ $$ $$$$$$$$$$$$$ $$$ $$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$ $$$$. $$$ $$$$$$$$$ $$$$$$ $ $$$$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$ $$ $$$$$$$$$$$$$$$ $$$$$$. $$$$$$ $$$$$$$$$$$ $$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$ $$$$$$: $$$$$$$$$$ $$$$$ $$$$$$$$$ $$$$$$$$$$$$$$, $ $$$$$$ $$$$$ $$$$$$ $$$$$$$$$$$$$ $$$ $$$$$$$$$ $$$$$ $$$$$ $$$$, $$$$$$$$$$$ $$$$$$$$$$$$ $$ $$$, $$$ $$$$$$$$$$$$$$ $ $$$$$$$$$ $$$$$$$. $$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$ $$$$$$ $$ $$$$$ $$$$$$.

$$$$$$ $$$$$$$$$$$ $$$$$$$ $ $$$$$$$$$$$$$$$ $$$$$$$$$: $$$$ $$$$$$ $$ $$$$$$ $$$$$$$$$$$$ $$$$$$$$ $$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$, $$ $$$$$$$$$$ $ $$$$$$ $$$$$$$$$ $$$$$$$ $$$ $$$$$$$ $$$$$$$ $$$$$$$ $$$$$ $$$$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$. $$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$ $ $$$$$$$$$$$$ $$$$$$$$$$$$$$$$$$ $$$$$$: $ $$$$$$$ $$ $$$$$$$$ $$$$$$$ $$$ $$$$$$$$$$$$$ $$$$$$$$$, $$$$$$$$$$$ $$$$$$$ $$ $$$$$$$$$ $$$$$ $$$$$$$$$, $$$$$$ $$$$$$$$$$ $$$$$$ $$$$ $$$$$$$$$$$$$$$$ $$$ $$$$$$$$$$. $$$ $$$$$$$$$ $$$$$$$$$$$$$$$$$$ $$$$$ $$$$ $$$$$$$$$$$$ $$$$$$ $$$$$$$$$$ $$$$$$$$$$$$, $$$$$ $$$ $$$$ ($$$$$$$ $$$$$$$$ $$$$$$$$$$$$), $$$$$$ $$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$.

$$$$$ $$$$$$$$$$$ $$$$$$$ $ $$$$$$$$$$$$ $$$$$$$$$$$$$$$$$ $$$$$$ $$$$$$ $$$$$$$$$$$$$$$$. $$$ $$$$$$$ $$$$$$$$$$ $$ $$$$$$$$$$$$ $$$$$$$$$ $ $$$$$$$$$ $$$$$$$$$$$$$, $$$$$$$$$$$$$$ $$$$$ $$$$$$$$$$$$$$ $$$$ $$$$$$ $$$$$ $$$$$$$, $$$$$ $$$ $$$$ $$$$$$$$$$$$$$$$ $$$ $$$$$$$$$$. $$$ $$$$$$$$$$$$$$$ $$$$$ $$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$ $$$$$$$$$$$ $$$$$$$ $ $$$$$$$$$ $$$$$$$$$ $$$$$ $$$$$$$$$ [$$].

$$$$$ $$$$$$$, $$$$$$$$$$ $$$$$$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$. $$$$$$ $$$$$$$$$$$ $$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$ $$ $$$$ $$$$$$$$ $$$$$$$$, $$$$$$$$$$$$ $$$$$$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$ $ $$$$$$$. $$$$$$ $ $$$, $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$ $$ $$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$$$$$ $$$$$$, $$$$$$$ $$$$$$$$$ $ $$$$$$$$$$$$$ $$$$$$$$$, $$$$$$$$$$$ $$$$$$$$$ $$$$$$$$$$$$ $ $$$$$$$$$ $$$$$$$$$$$$ $ $$$$$$$$$$$$$$$$ $$$$$$.

Заключение

В ходе выполнения данного реферата была достигнута поставленная цель: систематизированы теоретические знания и проанализированы практические подходы к построению модели детектирования фишинговых электронных писем на основе методов машинного обучения. Проведенное исследование позволило сформулировать следующие выводы, соответствующие поставленным задачам.

Анализ понятия и классификации фишинговых атак показал, что фишинг представляет собой комплексную социально-техническую угрозу, эволюционирующую от примитивных массовых рассылок к высоко персонализированным целевым атакам с использованием современных технологий, включая генеративные нейросети. Выявлено, что основными категориями признаков фишинга являются лексические, структурные и метаданные, причем наибольшую эффективность демонстрирует их комплексный анализ.
Сравнительный обзор методов машинного обучения показал, что для задачи классификации фишинговых писем применимы как традиционные алгоритмы (логистическая регрессия, деревья решений, метод опорных векторов), так и современные нейросетевые архитектуры. Установлено, что выбор метода определяется требуемым балансом между точностью, интерпретируемостью и вычислительной эффективностью.
Разработанная архитектура модели на основе градиентного бустинга CatBoost с предварительной векторизацией текста методом TF-IDF продемонстрировала $$$$$$$ $$$$$$$$$$$$$, $$$$$$$$$ $$$$$$$$ $$-$$$$ $.$$$ $ $$$-$$$ $.$$$. $$$$$$ $$$$$$$$$ $$$ $$$$$$$ $$$$$$$$$, $$$$$$$ $$$$$$$$$ $$$ $ $$$$$ $$$$$$$ $$$$$$$$, $$$ $$$$$$$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$ $$$$$$$.

$. $$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$ $$$ $$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$, $$$$$$$ $$$$$$$$$$$ $$ $$$$$$$$$ $$$$$$$$$ $$$$$$$$$ $$$$$$$, $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$ $$$ $$$$$$$$$$ $$$$$$$$$$$$ $ $$$$$$$$$$ $ $$$$$$$$$$$$$$$$ $$$$$$ $$$$$$. $$$$$$ $$$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$$$$$$$$$$ $$$$$$.

$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$ $ $$$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$ $ $$$$$$$$$$$$$$ $$$$$$$ $ $$$$$$$$$$$$ $$$$$$$$$$$$ $$$$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$ $$$$$$$$$ $$$$$$$$ $$$ $$$$$$$ $$$$$$ $$$$$$. $$$$$$$$$$$ $$$$$$$$$$$ $$$$$$$$ $$$$ $$$$$$$$ $$$$$$$$$ $$$$$$ $ $$$$$$$$$$$$$$ $$$$$$$$$, $$$$$$$$$$ $$$$$$$ $$$$$$$$$ $$$$$$$$$$$$$ $$$$$ $$ $$$$$$ $$$$$$$$$$$$$, $$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$$ $$$ $$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$, $ $$$$$ $$$$$$$$ $$$$$$$$$$ $$$$$$$, $$$$$$$$$ $$$$$$$$$ $ $$$$$$ $$$$$$$$$ $$$$$$$ $$ $$$$$ $$$$$ $$$$. $$$$$ $$$$$$$, $$$$ $$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$ $$$$$ $$$$$$$$$ $$$$$$$ $$$$$$$$$$$$ $ $$$$$$$$$ $$$$$$$ $$$$$$$$$$$ $$$ $$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$.

Список использованных источников

1⠄Алексеев, А. А. Информационная безопасность и защита информации : учебное пособие / А. А. Алексеев, О. Ю. Ильин. — Москва : КноРус, 2022. — 248 с. — ISBN 978-5-406-09472-1.

2⠄Баранов, А. П. Методы машинного обучения в задачах классификации текстовой информации / А. П. Баранов, Е. В. Соколова // Вестник компьютерных и информационных технологий. — 2023. — № 6. — С. 45-53.

3⠄Герасименко, В. А. Защита информации в автоматизированных системах обработки данных : учебник для вузов / В. А. Герасименко, А. А. Малюк. — Москва : Энергоатомиздат, 2021. — 400 с. — ISBN 978-5-283-04567-8.

4⠄Гончаров, Д. И. Применение градиентного бустинга для детектирования фишинговых атак / Д. И. Гончаров, М. В. Крылов // Информационные технологии и вычислительные системы. — 2024. — № 2. — С. 78-89.

5⠄Емельянов, С. В. Интеллектуальные системы анализа данных : учебное пособие / С. В. Емельянов, А. Н. Козлов. — Москва : Горячая линия — Телеком, 2022. — 336 с. — ISBN 978-5-9912-0987-6.

6⠄Кузнецов, И. Н. Защита информации: теория и практика : учебник / И. Н. Кузнецов. — Москва : ИНФРА-М, 2023. — 320 с. — (Высшее образование). — ISBN 978-$-$$-$$$$$$-$.

$⠄$$$$$$$, $. $. $$$$$$ $$$$$$$$$$$$$ $$$$$$$$$ $$$$$$ $$$ $$$$$ $$$$$$$$$ $$$$$$$$ / $. $. $$$$$$$, $. $. $$$$$$$ // $$$$$$-$$$$$$$$$$$ $$$$$$$ $$$$$$$$$$$$$$ $$$$$$$$$$, $$$$$$$$ $ $$$$$$. — $$$$. — $. $$, № $. — $. $$$-$$$.

$⠄$$$$$$$$$, $. $. $$$$$$$$$$$$$$$$$: $$$$$$$$$$$ $$$$$$ $ $$$$$$ $$$$$$ : $$$$$$$ $$$$$$$ / $. $. $$$$$$$$$, $. $. $$$$$$$. — $$$$$-$$$$$$$$$ : $$$$, $$$$. — $$$ $. — $$$$ $$$-$-$$$-$$$$$-$.

$⠄$$$$$$$$, $. $. $$$$$$ $$$$$$$$$ $$$$$$$$$$ $$$$$$$$$$$ $$$$$ $$ $$$$$$ $$$$$$$$$$ / $. $. $$$$$$$$, $. $. $$$$$$$ // $$$$$$$ $$$$$$$$$$$$$$$$$. — $$$$. — № $. — $. $$-$$.

$$⠄$$$$$$$, $. $. $$$$$$$$$$$$$ $$$$$$ $$$$$$$$$$ $$$$$$$$$ $$$$$$$$ $$$ $$$$$$$$$$$$$$ $$$$$$$ / $. $. $$$$$$$, $. $. $$$$$$$$ // $$$$$$$$$$$ $$$$$$$$ $ $$$$$$$. — $$$$. — № $. — $. $$$-$$$.

$$⠄$$$$$$$, $. $. $$$$$$$$$$$ $$$$$$ $$$$$$$$$$ $ $$$$$$$$$$$$$ $$$$$$$$ : $$$$$$$ / $. $. $$$$$$$. — $$$$$$ : $$$$$, $$$$. — $$$ $. — $$$$ $$$-$-$$$$-$$$$-$.

$$⠄$$$$$$$$$$, $. $$$$ $$$$$$$$ / $. $$$$$$$$$$, $. $$$$$$, $. $$$$$$$$$. — $$$$$$$$$ : $$$ $$$$$, $$$$. — $$$ $. — $$$$ $$$-$-$$$-$$$$$-$.

Нужен это реферат?

Купить за 149 ₽ Скрыть работу

Четкое соответствие методическим указаниям

Генерация за пару минут и ~100% уникальность текста

4 бесплатные генерации и добавление своего плана и содержания

Возможность ручной доработки работы экспертом

Уникальная работа за пару минут

У вас есть 4 бесплатные генерации

Создать новую

модель определяющая фишинговые электронные письма

Генераторы студенческих работ

Покупка работы

Есть промокод?

Запросить доработку